DE102006031979A1 - Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung - Google Patents

Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung Download PDF

Info

Publication number
DE102006031979A1
DE102006031979A1 DE102006031979A DE102006031979A DE102006031979A1 DE 102006031979 A1 DE102006031979 A1 DE 102006031979A1 DE 102006031979 A DE102006031979 A DE 102006031979A DE 102006031979 A DE102006031979 A DE 102006031979A DE 102006031979 A1 DE102006031979 A1 DE 102006031979A1
Authority
DE
Germany
Prior art keywords
biological
components
network
activity
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102006031979A
Other languages
English (en)
Inventor
Andreas Dr. Schuppert
Heidrun Dr. Ellinger-Ziegelbauer
Hans-Jürgen Dr. Ahr
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer AG
Original Assignee
Bayer Technology Services GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer Technology Services GmbH filed Critical Bayer Technology Services GmbH
Priority to DE102006031979A priority Critical patent/DE102006031979A1/de
Priority to US12/307,987 priority patent/US20090326897A1/en
Priority to EP07764902A priority patent/EP2041682A1/de
Priority to PCT/EP2007/005712 priority patent/WO2008006469A1/de
Publication of DE102006031979A1 publication Critical patent/DE102006031979A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung, umfassend die folgenden Schritte: (a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk, umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems; (c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks; (d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologischen Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird; (e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben; (f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung; (g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellen linearen Modells zur Beschreibung ...

Description

  • Die Erfindung betrifft ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung.
  • Eukariotische wie auch prokariotische Zellen, die einem externen Stress ausgesetzt sind, zeigen signifikante Änderungen der Expression mehr oder weniger großer Gruppen von Genen, wobei bis zu 30 % aller Gene beeinflusst sein können. Hieraus lässt sich ableiten, dass eine Änderung der Genexpression als Antwort auf einen Stress weder ein lokales Phänomen in einem Netzwerk einander regulierender Gene darstellt, noch dass die Stressantwort auf isolierte Gene, Moleküle oder Signalwege beschränkt ist, selbst wenn die kausale Wirkungsweise des Stresses direkt lediglich wenige Gene betreffen mag. Zwischen verschiedenen Signalwegen besteht offensichtlich eine gegenseitige Beeinflussung und ein hoher Informationsaustausch, der es einer Zelle erlaubt, die zelluläre Stressantwort von ihrer lokalen Wirkung auf große Teile der Genexpression auszudehnen.
  • Die allgemeine Wirkung auf einen toxischen Stress auf Proteinebene wurde beispielsweise für Protein-Proteinwechselwirkung Netzwerk in S. cerevisae und E. coli-Bakterien untersucht, wobei gezeigt werden konnte, dass ein toxischer Stress eine Stressantwort großer Gruppen von Proteinen hervorruft.
  • Es wird angenommen, dass die Organisationsstruktur der Stressantwort in Form sehr komplex wechselwirkender Hierarchien zu beschreiben ist, die ihrerseits auf lokalen Wechselwirkungen im Gesamtnetzwerk beruhen, die als biologische Signalwege und umfassende funktionelle Module interpretiert werden können. Die biologische Regulation eines Stresses kann somit umfassende Auswirkungen auf die Aktivität zellulärer Netzwerke haben und einen Austausch zwischen verschiedenen Signalwegen und funktionellen Einheiten beinhalten.
  • Eine globale Modulation der Genexpression legt nahe, dass ein ganzheitlicher Ansatz auf der Basis von generischen Eigenschaften von großräumigen Mechanismen der Stressantwort in Netzwerken geeignet sein könnte, eine solche Stressantwort zu beschreiben.
  • Im Stand der Technik sind Verfahren zur Bestimmung einer solchen Stressantwort bekannt. Beispielsweise offenbart die Schrift WO 03/077062 sowie in "Gardner et al., Science, Vol. 301 (5629), S. 102-5 (4. Juli 2003)" ein Modell zur Beschreibung einer stressinduzierten Änderung der Genexpression unter Verwendung einer Gruppe von Differenzialgleichungen, die die Aktivität der einzelnen Elemente des Netzwerks durch Variablen wiedergeben. Nachteilig bei diesem Modell ist jedoch, dass die die Gleichungen quantifizierende Matrix, die die Interaktionen der einzelnen Elemente beschreibt, explizit berechnet werden muss. Voraussetzung für die explizite Berechnung der Interaktion der einzelnen Elemente ist, dass die Interaktion der einzelnen Elemente bekannt ist. Dies ist beispielsweise für Gene in den wenigstens Fällen ausreichend bekannt. Dann beinhaltet eine solche Berechnung, dass experimentell über exakt definierte Störungen die Wechselwirkung der einzelnen Komponenten ermittelt werden muss. Für eine größere Anzahl an Elementen ist eine explizite Berechnung mit diesem Model somit nicht möglich und das beschreibbare Netzwerk ist auf eine sehr geringe Zahl an Elementen und deren Wechselwirkungen beschränkt.
  • Der Erfindung lag entsprechend die Aufgabe zugrunde, ein Modell zur Beschreibung von Änderungen der Genexpression als Antwort auf einen externen Stress zur Verfügung zu stellen, das die vorgenannten Nachteile des Standes der Technik überwindet. Insbesondere war die Aufgabe der vorliegenden Erfindung ein Verfahren zur Verfügung zu stellen, das eine Bestimmung einer Stressantwort in Netzwerken ermöglicht, ohne dass die explizite Wechselwirkung der Elemente bekannt sein muss.
  • Erfindungsgemäß wird die Aufgabe dadurch gelöst, dass ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung zur Verfügung gestellt wird, das die folgenden Schritte umfasst:
    • (a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst;
    • (b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems;
    • (c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks;
    • (d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird;
    • (e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben;
    • (f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung;
    • (g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks und der in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponenten) des biologischen Netzwerks nach der reversiblen Störung, unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n); und
    • (h) optional Vergleichen zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) besteht.
  • Weitere Gegenstände der vorliegenden Erfindung betreffen ein Computerprogrammprodukt, ein Computerprogramm und ein Computersystem zur Ausführung eines oder mehrerer Schritte des erfindungsgemäßen Verfahrens.
  • Weitere vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den Unteransprüchen.
  • Unter dem Begriff "biologisches System" wird im Sinne der vorliegenden Erfindung eine Zelle oder eine Zellpopulation, beispielsweise ein Gewebe oder ein Organ, wie die Leber, oder ein multizellulärer Organismen, insbesondere ein Säugetier wie Maus oder Ratte, verstanden. In bevorzugten Ausführungsformen ist das biologische System ausgewählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismen.
  • Ein biologisches System enthält eine Vielzahl von biologischen oder biochemischen Komponenten. Unter dem Begriff "biologische Komponente" werden im Sinne der vorliegenden Erfindung biologische zelluläre Bestandteile verschiedener Art verstanden, beispielsweise Gene, die miteinander in Verbindung stehen und/oder einander beeinflussen können. Es versteht sich, dass die Art der biologischen Komponente abhängt von der Art des betrachteten biologischen Systems. Ist das betrachtete biologische System eine Zelle, so sind die biologischen Komponenten ausgewählt aus der Gruppe zelluläre Bestandteile, insbesondere Gene. Ist das betrachtete biologische System eine Zellpopulation wie Gewebe oder Organ, so können die biologischen Komponenten Gene wie auch einzelne Zellen sein.
  • Unter dem Begriff "biochemische Komponente" werden im Sinne der vorliegenden Erfindung biochemische zelluläre Bestandteile verschiedener Art verstanden, beispielsweise Moleküle, die mit einander in Verbindung stehen und/oder einander beeinflussen können. In bevorzugten Ausführungsformen ist die biochemische Komponente ausgewählt aus der Gruppe umfassend in der Zelle oder Zellpopulationen enthaltenen Molekülen wie Desoxyribonukleinsäure (DNA, DNS), Ribonukleinsäure (RNA, RNS), Proteine und/oder Metabolite.
  • Unter dem Begriff "Aktivität" wird im Sinne der vorliegenden Erfindung verstanden, dass eine biologische oder biochemische Komponente eine Eigenschaft oder Funktion aufweist. Beispielsweise werden Gene oder Proteine entweder exprimiert oder nicht exprimiert oder weisen eine Expressionsrate auf, die beispielsweise als Gehalt an RNA oder Genprodukt bestimmbar ist. Weiterhin können Gene oder Proteine in bestimmter Menge oder Konzentration vorliegen, Funktionen ausüben, beispielsweise katalytische Wirkungen, die durch chemische Modifizierung des Gens oder Proteins variiert werden kann. Einer Aktivität oder dem Zustand einer Aktivität kann die Menge, Konzentration, Expressionsrate oder katalytische Funktion entsprechen. Eine chemische Modifizierung oder Funktionalisierung einer Komponente, beispielsweise eines Gens oder Proteins, kann einem Aktivitätszustand entsprechend, es kann im Rahmen der Erfindung jedoch auch vorgesehen sein, dass eine chemische Modifizierung oder Funktionalisierung zwei verschiedene biologische oder biochemische Komponenten definieren kann.
  • Unter dem Begriff "biologisches Netzwerk" wird im Sinne der vorliegenden Erfindung eine Gruppe oder Vielzahl von biologischen oder biochemischen Komponenten verstanden, die einander beeinflussen und/oder Auswirkungen auf die Aktivität anderer Komponenten haben können. Ein biologisches Netzwerk enthält vorzugsweise biologische oder biochemische Komponenten einer Art, es kann jedoch auch vorgesehen sein, dass ein biologisches Netzwerk biologische und/oder biochemische Komponenten verschiedener Art enthalten kann, die einander beeinflussen können. Beispielsweise kann ein biologisches Netzwerk Gene, RNA-Moleküle, Proteine und/oder Metaboliten aufweisen, die einander gegenseitig in ihrer jeweiligen Aktivität beeinflussen können.
  • Unter dem Begriff "reversible Störung" wird im Sinne der vorliegenden Erfindung verstanden, dass die biologischen oder biochemischen Komponenten, das biologische Netzwerk und/oder das biologische System beeinflusst werden, wobei eine Störung insbesondere ein Stress sein kann, der auf das System wirkt. Insbesondere kann der Stress ein externer Stress sein, der von außen auf das System wirkt. Vorzugsweise ist ein Stress ausgewählt aus der Gruppe umfassend toxischer Stresse, bevorzugt Stress durch nicht-genotoxische oder genotoxische Hepatokarzinogene, Stress durch Applikation eines pharmazeutischen Wirkstoffs, Wärmestress oder Hunger. Ein Stress, der eine Störung des Systems verursacht, kann ebenfalls ein Wirkstoff und/oder ein Medikament sein, das dem System beigebracht wird. Eine Störung oder Stress ist dann reversibel, wenn das System nach Entfernen der Störung oder des Stresses in seinen Ausgangszustand zurückkehrt.
  • Eine Störung ruft im Sinne der Erfindung eine "Reaktion" der biologischen oder biochemischen Komponenten hervor. Unter dem Begriff "Reaktion" wird im Sinne der vorliegenden Erfindung verstanden, dass die Aktivität wenigstens einer der biologischen oder biochemischen Komponenten durch die Störung verändert wird. Beispielsweise kann durch eine Störung die Aktivität wenigstens einer biologischen oder biochemischen Komponenten geändert werden. Diese Änderung der wenigstens einen biologischen oder biochemischen Komponente kann wiederum die Aktivität wenigstens einer weiteren biologischen oder biochemischen Komponente beeinflussen. Eine Störung kann durch direkte oder indirekte Beeinflussung der biologischen oder biochemischen Komponenten eines biologischen Systems eine Reaktion einer, mehrerer oder einer Vielzahl der biologischen oder biochemischen Komponenten hervorrufen. Diese Reaktion der Komponenten bildet die Reaktion des Netzwerks, die entsprechend durch die Reaktion wenigstens einer, mehrerer oder vieler der biologischen oder biochemischen Komponenten ausgebildet wird.
  • Beispielsweise kann ein Wirkstoff nur die Aktivität eines Proteins beeinflussen oder die Konzentration eines Metaboliten erhöhen. Ein toxischer Stress kann beispielsweise viele verschiedene Gene direkt und indirekt in ihrer Aktivität beeinflussen und eine großräumige Stressantwort hervorrufen.
  • Unter dem Begriff "Verhalten des biologischen Netzwerks" wird im Sinne der vorliegenden Erfindung verstanden, dass das biologische Netzwerk auf die Änderung der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten reagiert, indem die gegenseitige Beeinflussung der Komponenten Auswirkungen auf die Aktivität anderer Komponenten hat und das Netzwerk durch die Reaktionen der einzelnen Komponenten insgesamt seine Aktivität ändert. Beispielsweise kann ein Gen als Reaktion auf einen Stress seine Expression ändern, wobei die Expressionsänderung dieses Gens die Expression eines oder mehrerer anderer Gene beeinflusst, die untereinander oder bei weiteren Gene ebenfalls Expressionsänderungen bewirken können. Als Folge davon wird das Netzwerk miteinander korrespondierender Gene insgesamt eine Änderung bzw. Verschiebung der Expression erfahren.
  • Unter dem Begriff "Rauschen" wird im Sinne der vorliegenden Erfindung verstanden, dass die Reaktion der biologischen oder biochemischen Komponenten auf eine identische externe Störung oder Stress nicht identisch sein muss, sondern insbesondere bei biologischen Systemen eine Variation aufweist. Diese Variation kann beispielsweise graduelle Unterschiede in der Änderung der Expression eines Gens oder Proteins auf einen identischen Stressfaktor unter identischen Bedingungen hervorrufen. Diese Variation oder "Rauschen" der Reaktion der biologischen oder biochemischen Komponenten weist einen Rauschanteil, der auf Messrauschen und Messfehlern beruht, wie sie bei Experimenten regelmäßig auftreten, und einen biologischen Anteil auf, der im Sinne der vorliegenden Erfindung als "Biodiversität" bezeichnet wird. Ein Rauschen kann insbesondere eine Fluktuationen der Gen- oder Proteinexpression sein. Das "Rauschen" der Gen- und Proteinexpression aufgrund von Biodiversität ist beispielsweise beschrieben in Bar-Even el al., Nature Genetics, Vol. 38, Nr. 6, S. 636-643, 2006, auf die Bezug genommen wird.
  • Unter dem Begriff "Biodiversität" wird im Sinne der vorliegenden Erfindung eine biologische Variation verstanden. Biodiversität kann biologische Variationen ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren sein. Beispielsweise kann der Begriff "Biodiversität" in dem biologischen System einer Zelle oder eines Gewebes umfassend ein Netzwerk aus vielen einzelnen Genen eine natürliche Variation der Genexpression eines einzelnen Gens, mehrerer Gene und/oder eines Netzwerks von Genen, oder eine natürliche Variation der Proteinexpression eines einzelnen Proteins, mehrerer Proteine und/oder eines Netzwerks von Proteinen in einem Proteinnetzwerk umfassen. Weiterhin kann eine "Biodiversität" bei einem Vergleich verschiedener biologischer Systeme, beispielsweise verschiedener Organismen einer Spezies, Variationen ausgewählt aus der Gruppe umfassend eine Variation des Genotyps, eine Variation einzelner Organe und/oder eine unterschiedliche Reaktion des Organismus auf äußere Einflüsse wie Ernährung umfassen. Es versteht sich, dass die Biodiversität die Aktivität oder Reaktionen der Komponenten, Netzwerke und/oder Systeme einander beeinflusst, so dass die Biodiversität der Reaktion der Komponenten auf eine Störung sowohl auf der natürlichen Variation der Aktivität der Komponenten beruhen kann wie auch eine natürlichen Variation eines biologischen Systems und/oder einer Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren umfassen kann.
  • Der Begriff "Biomarker" wird als indirektes Beobachtungsverfahren für eine große Zahl intra- and extrazellulärer Ereignisse wie auch physiologische Änderungen eines Organismus verwendet, die nicht oder nur mit großem Aufwand direkt beobachtet werden können. Hierzu kann beispielsweise des Gehalts oder der Produktionsrate von Signalmolekülen, Transkriptionsfaktoren, Metaboliten, Gentranskripten oder Modifikationen von Proteinen nach der Translation, oder auch der physiologische Zustand eines biologischen Systems gehören. Unter dem Begriff "Biomarker" wird im Sinne der vorliegenden Erfindung insbesondere eine Kombination aus einem Gen, oder Genprodukt, ein Protein, oder eine Gruppe von Genen, Genprodukten oder Proteinen verstanden, das nach einer Störung verglichen mit der Aktivität vor der Störung auf- oder abreguliert wird, und ein entsprechendes Berechnungsverfahren zur Berechnung nicht direkt beobachtbarer Größen. Für einen Biomarker ist insbesondere eine biologische oder biochemische Komponente oder eine Gruppe davon, ein Gen oder eine Gruppe von Genen, das ausreichend spezifisch auf eine spezielle Störung reagiert wesentlich, so dass es allein oder in Kombination mit anderen Genen oder Genprodukten verwendbar ist, eine Klassifizierung von Störungen in Klassen, beispielsweise in Toxizitätsklassen, zu erlauben. Insbesondere ist ein Biomarker eine Kombination aus einer biologische oder biochemische Komponente oder eine Gruppe davon, ein Gen, eine Gruppe von Genen oder ein Genprodukt, die charakteristisch für eine Reaktion eines biologischen Systems auf eine bestimmte Störung ist, und einem zugehörigen Berechnungsverfahren.
  • Die Störung des Grundzustands der Aktivität bildet die Basis von Krankheiten, die mit einer Reaktion der Komponenten bzw. des Systems auf die Störung verbunden sind. Die vorliegende Erfindung beruht insbesondere auf der Hypothese, dass Störungen an beispielsweise toxischen Phänomenen beteiligt sein können und dass Biomarker d.h. eine oder mehrere Komponenten, die eine für die Reaktion des Systems charakteristische Aktivitätsänderung zeigen, wirksame Marker der Toxizität bilden könnten.
  • Ein Vorteil der vorliegenden Erfindung ist, dass dadurch, dass die Berechnung innerhalb des bereitgestellten linearen Modells zur Beschreibung des Verhaltens eines biologischen Netzwerks unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponenten erfolgt, das Verhalten des biologischen Netzwerks berechenbar ist, ohne dass die Wechselwirkung aller Komponenten explizit berechnet werden muss. Von besonderem Vorteil ist hierbei, dass das Verhalten des Netzwerks aus bestimmbaren oder messbaren Daten der Einzelreaktionen der Komponenten rekonstruierbar ist. Vorteilhafter Weise kann die Berechnung des Verhaltens des Netzwerks auf die Reaktionen der Komponenten auf die Störung und somit beobachtbare Größen zurückgeführt werden.
  • Insbesondere ist von großem Vorteil, dass es aufgrund der Berücksichtigung der Biodiversität erzeugten Variation der Reaktion der biologischen oder biochemischen Komponenten in dem Verfügung gestellten linearen Modell ermöglicht wird, das Verhalten des Netzwerks ohne systematische Experimente zu bestimmen.
  • Biologische Netzwerke können mathematisch dargestellt werden. Das im Rahmen des erfindungsgemäßen Verfahrens zur Verfügung gestellte lineare Modell zur Beschreibung des Verhaltens des biologischen Netzwerks umfasst eine mathematische Beschreibung der Reaktion biologischer oder biochemischer Komponenten eines Netzwerks auf eine reversible Störung. Eine reversible Störung, bei der das System wieder in seinen Ausgangszustand zurückkehrt, wenn der Stress entfernt wird, stört die Aktivität der Komponenten und führt zu einer Aktivitätsänderung der durch die Störung betroffenen Komponenten. Eine solche Änderung der Aktivität einer Komponente kann ihrerseits Auswirkung auf die Aktivität weiterer biologischer oder biochemischer Komponenten zeigen. Biologische und/oder biochemische Komponenten, die Komponenten eines biolo gischen Netzwerks sind, können miteinander Wechselwirken und einander in ihrer Aktivität regulieren. Die Regulation kann positiv oder negativ sein, beispielsweise eine Hoch- oder Runterregulation der Genexpression für den Fall, dass die Komponenten Gene sind oder eine Hoch- oder Runterregulation der Proteinexpression für den Fall, dass die Komponenten Proteine sind. Ein reversibles Stören der Aktivität wenigstens einer biologischen oder biochemischen Komponente erzeugt somit eine Reaktion der Komponenten des biologischen Netzwerks, die insgesamt die Reaktion des gesamten Netzwerks der Komponenten ausbilden.
  • Die Wechselwirkung oder Interaktion der einzelnen Komponenten in einem Netzwerk miteinander ist nicht zwangsläufig homogen. Einwertige Parameter können die Wechselwirkung der Komponenten daher nicht beschreiben und ein generischer Formalismus zur Berechnung des Verhaltens eines biologischen Netzwerks ist im Sinne dieser Erfindung vorzugsweise geeignet.
  • Eine bevorzugte generische Beschreibung kann das bereitgestellte lineare Modell zur Beschreibung des Verhaltens des biologischen Netzwerks gemäß der nachstehenden Gleichung (I) zur Verfügung stellen: x = A u (I)worin:
  • x: [x1 .... xn]
    ein Vektor ist, der die Bestimmung der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung umfasst,
    u:[u1 .... un]
    ist ein Vektor, der die Störung beschreibt,
    A:
    ist eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben,
    n
    ist die Anzahl der Komponenten.
  • Vorzugsweise beschreibt man die Matrix durch eine symmetrische n×n-Matrix, wobei n der Anzahl der Komponenten entspricht. Diese enthält die Bestandteile aij, die quantitativ die Reaktion einer Komponente i auf einen Stress uj beschreiben, der auf die Komponente j wirkt. Die Matrix A gibt also sowohl die Reaktion der Komponenten des Netzwerks auf die reversible Störung wieder als auch die Verteilung der Reaktion auf eine lokale Störung oder einen lokalen Stress, der nur auf nur wenige Komponenten wirkt, auf das ganze Netzwerk.
  • Der Vektor x, der die Änderung der Aktivität der einzelnen Komponenten angibt, gibt geeigneterweise Daten oder Messwerte wieder, die die Änderung der Aktivität der Komponenten nach einer reversiblen Störung beschreiben, nachdem die Komponenten des Netzwerks auf die Störung reagiert haben.
  • Die Komponenten reagieren abhängig von der Art der Komponente, beispielsweise Gene und/oder Proteine, und von der ausgeübten reversiblen Störung innerhalb unterschiedlicher Zeiträume auf die Störung mit einer Änderung ihrer Aktivität, wobei die Zeiträume einer reversiblen Reaktion der Komponenten können hierbei im Bereich von Minuten, Stunden oder Tagen liegen können. Diese Zeiträume sind dem Fachmann bekannt und/oder bestimmbar. Vorzugsweise sind im Schritt (f) schnelle Reaktionen der Komponenten bestimmbar, beispielsweise Änderungen der Genexpression, die vorzugsweise im Bereich von 0,5 Stunden bis 24 Stunden nach dem Ausüben einer reversiblen Störung auftreten.
  • Die Größe der Matrix A hängt ab von der Anzahl an biologischen oder biochemischen Komponenten des Netzwerks. Diese Zahl kann in biologischen Netzwerken und/oder Systeme in weiten Bereichen variieren. Ist das biologische System beispielsweise eine Zelle und die Komponenten sind Gene, können mehrere tausend Gene in einem Netzwerk enthalten sein. Die Größe eines solchen Netzwerks kann ebenfalls abhängig sein von der Störung, die auf das System einwirkt. Ist eine solche Störung beispielsweise ein toxischer Stress, können mehrere tausend Gene durch einen solchen Stress betroffen sein.
  • Anzahl der Komponenten n kann im Bereich von ≥ 1 Komponente bis ≥ 25.000 Komponenten, vorzugsweise im Bereich von ≥ 1 Komponente bis ≤ 15.000 Komponenten, bevorzugt im Bereich von ≥ 1 Komponente bis ≤ 5000 Komponenten, besonders bevorzugt im Bereich von ≥ 2 Komponenten bis ≤ 1000 Komponenten, weiter vorzugsweise im Bereich von ≥ 5 Komponenten bis ≤ 400 Komponenten, noch vorzugsweise im Bereich von ≥ 5 Komponenten bis ≤ 200 Komponenten liegen.
  • In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens werden die Eigenschaften der Matrix A aus der bestimmbaren Änderung der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks nach der reversiblen Störung unter Berücksichtigung der Biodiversität der Reaktion der Komponenten beschrieben. Eine solche Berechnung erfolgt vorzugsweise dadurch, dass der Vektor u, der die Störung beschreibt, die auf die Komponenten wirkt, einen Rauschanteil aufweist, der das Messrauschen wiedergibt, das beispielsweise durch Messungenauigkeiten und/oder Messfehler verursacht werden kann, und einen Rauschanteil, der das Rauschen aufgrund der Biodiversität der Reaktion der Komponenten wiedergibt, wobei die Biodiversität dieser Reaktion die biologische Variation der Reaktion der Komponenten wiedergibt.
  • Das bereitgestellte lineare Modell zur Beschreibung des Verhaltens des Netzwerks umfassend die Matrix A ist eine lineare Näherung eines nicht linearen Systems. Eine solche lineare Näherung des Verhaltens des Netzwerks ist einem grundsätzlich nicht linearen System dann äquivalent, wenn sich das System in oder nahe einem stationären Zustand befindet. Ist das biologische System beispielsweise eine Zelle, eine Zellkultur oder ein Organismus, beispielsweise eine Ratte, bedeutet dies, dass Zellen oder Organismen vorzugsweise in einer konstanten Umgebung zu halten sind.
  • Im Rahmen dieses erfindungsgemäßen Verfahrens wird weiterhin eine reversible Störung bevorzugt ein reversibler Stress auf das System ausgeübt, wobei das System nach Entfernen der Störung oder des Stresses in den Ausgangszustand zurückkehrt. Eine solche reversible Störung erlaubt entsprechend die Anwendung eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks. Die Rückkehr des Systems in den Ausgangszustand umfasst regelmäßig ein sogenanntes Rauschen, das im Sinne der vorliegenden Erfindung so verstanden wird, dass die Reaktion der biologischen oder biochemischen Komponenten auf eine identische Störung oder Stress nicht identisch sein muss, sondern eine Variation aufweist. Diese Variation bedingt, dass die Komponenten den Ausgangszustand erreichen können oder sich dem Ausgangszustand nähern können, wobei der Zustand den das System bzw. die einzelne Komponente nach der Störung einnimmt, ihrem Ausgangszustand entspricht, der durch das Rauschen überlagert ist.
  • Dieses Rauschen oder Variationen der Reaktion der biologischen oder biochemischen Komponenten und/oder des biologischen Systems lässt sich in einen Rauschanteil unterteilen, der auf Messrauschen und/oder Messfehlern beruht und einen biologischen Rauschanteil, der auf der biologischen Variation der Komponenten und/oder des Systems beruht und im Sinne der vorliegenden Erfindung als Biodiversität bezeichnet wird.
  • Ist die Komponente beispielsweise ein Gen und das biologische System ein Gewebe oder eine Zelle, dem ein Stress zugefügt wird, führt das Rauschen dazu, dass die Expression eines Gens, nachdem sie sich als Reaktion auf die reversible Störung geändert hat, nach Ende der Störung ihren Ausgangswert nicht exakt wieder einnehmen muss, sondern um den Ausgangswert variieren kann. Auch bei einer oder mehreren Wiederholungen beispielsweise in wenigstens einem identischen System und/oder mit wenigstens einer identischen Störung oder Stress, wird die Komponente bzw. das System nach einer reversiblen Störung in den Ausgangszustand zurückkehren bzw. einen Zustand einnehmen, der eine Variation oder Streuung um den Ausgangszustand aufweist.
  • Es wird für die Anwendung des Modells zur Voraussage des Verhaltens des Netzwerks vorausgesetzt, dass sich das System sich in einem stationären Zustand oder "steady state" befindet. Das Ausüben einer reversiblen Störung oder eines reversiblen Stresses führt dazu, dass das System nach Entfernen der Störung oder des Stresses in diesen stationären Ausgangszustand bis auf Abweichungen, erzeugt durch die Biodiversität, zurückkehrt.
  • Gemäß dem erfindungsgemäßen Verfahren bestimmt man in Schritt (c) die Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks im Ausgangszustand, stört gemäß Schritt (d) reversible die Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird, und bestimmt gemäß Schritt (e) die Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben.
  • Vorteilhafter Weise ist eine Wiederholung des erfindungsgemäßen Verfahrens zur Voraussage des Verhaltens des Netzwerks nicht notwendig. Somit liegt ein besonderer Vorteil des Verfahrens darin, dass eine Berechnung ermöglicht wird, durch eine Messung nach einer Störung in einem System und der Ausgangszustand bekannt ist oder bestimmt wird.
  • Unter der Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponenten weist der Vektor u, der die auf jede Komponente wirkende Störung beschreibt, einen Anteil auf, der das Messrauschen wiedergibt und einen Anteil, der die biologische Variation oder Biodiversität wiedergibt. Wird der Anteil des Messrauschens als konstanter Faktor betrachtet, kann die Reaktion auf eine Störung als auf die Biodiversität beschränkt angenommen werden. Weiterhin kann angenommen werden, dass die Biodiversität oder der biologische Anteil des Rauschens eine energetische Gleichverteilung aufweist und in Bezug auf die einzelnen Parameter u1 bis un eine Gleichverteilung aufweist. Die einzelnen Parameter u1 bis un werden auch als Anregungsmoden bezeichnet.
  • In bevorzugten Ausführungsformen des Verfahrens wird die Matrix durch eine Projektion der Daten der Änderung der bestimmten Aktivität der Komponenten auf ihre Eigenvektoren mit Hilfe der Korrelationskoeffizienten von Komponentenpaaren des biologischen Netzwerks beschrieben.
  • Die Eigenvektoren der Matrix A beschreiben formal Komponentengruppen des Netzwerks, die sich in ihrer Reaktion auf eine Störung oder Stress kohärent verhalten. Der zugehörige Eigenwert beschreibt die Sensitivität auf eine Störung oder Stress der jeweiligen Komponentengruppe bei kohärentem Reaktionsverhalten.
  • Die Korrelationskoeffizienten der Komponentenpaare des biologischen Netzwerks sind in Form der Eigenwerte und Eigenvektoren der Matrix A bestimmbar. Die Eigenwerte sind erhältlich aus der Biodiversität der Reaktion der Komponenten unter der Annahme, dass die Biodiversität einem thermischen Rauschen entspricht. Unter dieser Voraussetzung kann das Reaktionsverhalten des Netzwerks respektive die relevanten Eigenvektoren der Matrix A aus eine Analyse des Rauschverhaltens berechnet werden.
  • Die Matrix A sei vorzugsweise eine elastische Matrix. Hierbei sei {λi *} die Menge der Eigenwerte von A und {ϕi} seien die entsprechenden othonormierten Eigenvektoren.
  • Dann kann die Steifigkeit des Netzwerks ausgedrückt werden durch die inversen Eigenwerte: 1/λi* =: λi so dass λi die Steifigkeit der Systemantwort in Richtung des i-ten Eigenvektors unter einer Störung oder Stress beschreibt.
  • Mit Gleichung (I) kann x dargestellt werden durch Projektionen auf die Eigenvektoren von A gemäß Gleichung (S2):
    Figure 00120001
    worin <u, φk> das Skalarprodukt zwischen zwei Vektoren ist.
  • Weiterhin sei {ωk}, eine Störung des Systems mit der Struktur eines weißen Rauschens um den stationären Zustand, worin k der Index der Datensätze ist und die Dimension von (ωk) = n ist.
  • Dann sei ohne Beschränkung der Allgemeinheit:
    <|ω|> = 1
    ωk und ωl sind unkorreliert: <<ωk, ωl>>Datensätze = δk,l
    wobei ωl die Bedeutung einer Störung des Systems in Richtung des i-ten Eigenvektors hat, wobei die Störungseinflüsse in Richtung der Eigenvektoren des Systems unkorreliert sein sind, so dass der Ausdruck <<ωk, ωl>> 0 ist, wenn k ungleich i ist.
  • Unter diesen Annahmen gehorcht die Auslenkung ηi k als Projektion dem Zustand auf den i-ten Eigenvektor von A der durch das Rauschen induzierten Störung von x durch ωk, entsprechend der mittleren Amplitude der rauschinduzierten Auslenkung des Systems in Richtung des i-ten Eigenvektors, den im folgenden dargestellten Bedingungen.
  • Entsprechend den Annahmen der Thermodynamik verteilt sich die durch ein weißes Rauschen induzierte Dehnungsenergie in einem elastischen Netzwerk gleichmäßig auf alle Eigenvektoren, so dass für die Erwartungswerte der Momente der Amplituden die folgende Gleichung (S3) gilt:
    Figure 00130001
    mit Z als der Zustandssumme gemäß der folgenden Gleichung (S4):
    Figure 00130002
    und <|ηi|2>T als Mittelwert über alle Datensätze erhältlich aus den bereitgestellten Systemen, beispielsweise einer Anzahl bereitgestellter Gewebe.
  • Aus diesen Gleichungen für die Amplitudenverteilung (S3) kann die Statistik für die rauschinduzierten Auslenkungen ξi in den Originalkoordinaten um den stationären Zustand durch Projektion der Amplitudenstatistik auf die Eigenvektoren gemäß der folgenden Gleichung (S5) berechnet werden:
    Figure 00130003
    mit ϕk i als der i-ten Komponente des k-ten Eigenvektors. Hier bedeutet <ξi, ξj>T wieder den Mittelwert, gebildet über alle Datensätze, erhältlich aus den bereitgestellten Systemen, beispielsweise einer Anzahl bereitgestellter Gewebe.
  • Man erhält eine Beziehung gemäß der nachstehenden Gleichung (S6): i, ξj>T = |ξi||ξj|corTi, ξj) (S6)mit corTi, ξu) als den Korrelationskoeffizienten von ξi und ξj auf den Datensätzen für die Komponenten i und j, und i| = (<ξ2i >T)1/2 = σTi) =: σi als Länge des Vektors ξi auf dem Datensatz der Komponente i.
  • Eine Projektion des Stressvektors u = {u1, ..., un} auf die Eigenvektoren von A:
    Figure 00140001
    und ein Einsetzen in die Gleichung (S2) und Vertauschen der Summation ergibt für die Auslenkung von xi, induziert durch eine externe Störung oder Stress die nachstehende Gleichung (S7):
    Figure 00140002
  • Ein Einsetzen von Gleichung (S5) in Gleichung (S7) und Benutzen der Korrelation der rauschinduzierten Auslenkungen um den stationären Zustand, dargestellt durch Gleichung (S6), führt zu nachstehender Gleichung (S8):
    Figure 00140003
  • Sei nun formal:
    Figure 00140004
    die gewichtete Summe über die ξi, wobei die Gewichte uj die Störungskomponenten der j-ten Komponente des Systems ist. ξu ist ein Vektor mit einer Länge die gleich der Anzahl der bereitgestellten Systemen, beispielsweise Gewebeproben, und beschreibt die effektive Störung oder den effektiven Stress auf jedes System, beispielsweise eine Gewebeprobe, und hängt nicht von den Komponenten i ab.
  • Unter Verwendung von ξu wird die Analyse vereinfacht zu nachstehender Gleichung (S9):
    Figure 00140005
  • Hieraus folgt wegen |ξi| = σi die folgende Proportionalitätsrelation (S10):
    Figure 00150001
    mit dem "effektiven Stressvektor" ξu, der unabhängig von den Komponenten i ist und aus den Daten der Aktivität der Komponenten identifiziert werden muss.
  • Die Proportionalitätskonstante der Gleichung (S10) entsprechend dem Term |u| σu der Gleichungen (IV) bis (VI) und ein Wert ξu j für jeden Datensatz j ist mittels Auflösen eines linearen Gleichungssystems berechenbar.
  • Die Berechnung kann vorzugsweise im Rahmen einer Parameterschätzung durchgeführt werden. Bestimmbar sind die Daten der Aktivität der Komponenten, beispielsweise die Expressionswerte für alle Gene in dem System, beispielsweise einem Gewebe bzw. einer Probe des untersuchten Gewebes, an den stationären Zuständen. Daher ist die Anzahl der verfügbaren Datensätze für die Parameterschätzung gleich der Zahl der Komponenten mal der Zahl der Gewebeproben und damit um die Zahl der Gene mal größer als der Mindestbedarf der benötigten Datensätze.
  • Da die Parameterschätzung letztlich auf Auflösen eines kleinen linearen Gleichungssystems reduziert werden kann, kann vorteilhafter Weise eine deutlich höhere Stabilität als bei einer direkten Schätzung aller Komponenten der Matrix A erwartet werden.
  • Die Änderung der Aktivität einer Komponente i kann in Form der Korrelationskoeffizienten von Komponentenpaaren und der jeweiligen Standardabweichung gemäß der folgenden Gleichung (II) ausgedrückt werden.
    Figure 00150002
    worin:
  • xi:
    ist die Verschiebung der Aktivität der i-ten Komponente als Reaktion auf die Störung,
    σi:
    ist die Standardabweichung der Komponente i in einem "stratifizierten" System,
    cor(ξi, ξj):
    ist der lineare Korrelationskoeffizient zwischen den Änderungen der Aktivität der Komponenten i und j in dem stratifizierten System,
    uj:
    ist die Störung, die auf die Komponente j wirkt.
  • Der Begriff "stratifizieren" hat im Sinne der Berechnungen des erfindungsgemäßen Verfahrens die Bedeutung, dass für jede Komponente der Mittelwert der Aktivität vor und nach der ausgeübten Störung berechnet wird. Danach wird für jede Komponente und jeden Wert der Aktivität der jeweilige Mittelwert subtrahiert. In bevorzugten Ausführungsformen des Verfahrens hat der Begriff "stratifizieren" im Sinne der Berechnungen des erfindungsgemäßen Verfahrens die Bedeutung, dass für jedes bestimmte Gen der Mittelwert der Expression für jeden applizierten pharmazeutischen Wirkstoff, oder gemittelt über eine applizierte Stoffgruppe umfassend mehrere gleichwirkende Wirkstoffe, berechnet. Danach wird für jedes Gen und jeden Expressionswert der jeweilige Mittelwert subtrahiert. Hierdurch wird erreicht, dass nur noch die Schwankungen um den jeweils durch die Mittelwerte beschriebenen stationären Zustand oder Steady state berücksichtigt werden.
  • Unter Verwendung von |u| = (Σ uk 2)1/2, wobei k Koeffizienten für jede Komponente darstellen, die die Wirkung der Störung auf die Komponente darstellen, für die gesamte Störung ist die "effektive" Störung durch die folgende Gleichung (III)
    Figure 00160001
    worin:
  • ξu
    ist der formale Vektor der Aktivitätsänderung an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt und über gewichtete Mittelung über die x- Werte der beteiligten Komponenten berechnet wird,
    Σjujξj
    beschreibt die Berechnung des gewichteten Mittelwerts der Aktivitäten der Komponenten, die durch die Störung oder den Stress direkt beeinflusst werden,
    |u|
    die Intensität der Störung oder des Stress wiedergibt,
    umformulierbar.
  • Der Term |u| ist hierbei identisch mit 1/μ in Gleichung (S9) der formalen Herleitung.
  • In bevorzugten Ausführungsformen des Verfahrens sind die Daten der Aktivitätsänderung an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt, Expressionswerte für die Genexpression.
  • Diese Umformulierung der Störung erlaubt die Summe der Einwirkung einer Komponente j auf die durch die Störung verursachte Änderung der Aktivität einer Komponente i durch die nachstehende Gleichung (IV): xi = |u|σiσucor(ξj, ξu) (IV)worin:
  • xi:
    ist die Verschiebung der Aktivität der i-ten Komponente als Reaktion auf die Störung oder den Stress,
    |u|
    ist die Intensität der Störung,
    σu:
    ist die Standardabweichung der durch das Rauschen u erzeugten Antwort,
    σi:
    ist die Standardabweichung der Komponente i,
    cor(ξi, ξu):
    ist der lineare Korrelationskoeffizient zwischen den Änderungen der Aktivität der Komponenten i und j in dem stratifizierten System,
    auszudrücken. Hierbei entspricht σu dem |ξu| in Gleichung (S9).
  • Äquivalent kann die Gleichung (IV) durch die folgende algebraische Gleichung (V) ausgedrückt werden:
    Figure 00170001
    worin:
  • r:
    ist die Steigung.
  • Die Gleichungen (IV) und (V) beschreiben die Änderung der Aktivität der Komponenten durch eine reversible Störung, wobei die Berechnung erfolgt über die Stärke der Störung |u|, die Standardabweichung σi der ξi der Komponente i und einen Vektor ξu und σu, der die effektive Störung auf die Komponenten wiedergibt.
  • Die Gleichungen (IV) und (V) sind nicht länger abhängig von einer tatsächlichen Komponente i, so dass es für die Berechnung des Verhaltens des biologischen Mehrzwecks ausreichend ist, einen Vektor σuξu zu bestimmen und eine Zahl für |u| als "effektive Stärke der Störungen" zu bestimmen. Diese Bestimmung ist möglich über die bestimmten Daten der Änderung der Aktivität der Kompo nenten des Netzwerks, wobei |u| für sich genommen nicht messbar ist und die Größe, die in das Modell eingeht, r = |u|σu ist, wobei r durch lineare Regression aus Gleichung (V) mit Hilfe der Messdaten bestimmt werden kann.
  • Somit erlaubt das zur Verfügung gestellte Verfahren das Verhalten eines biologischen Netzwerks auf eine reversible Störung mit Hilfe des bereitgestellten linearen Modells aus den bestimmten Daten der Änderung der Aktivität der Komponenten als Reaktion auf eine reversible Störung zu berechnen.
  • Der Anstieg r = |u| σu stellt ein Maß für die Sensitivität der Änderung der Aktivität der Komponenten zur Verfügung, mit einem Bezug auf den formalen Abstand der Komponente i auf den Ort des Wirkens des Stresses ausgedrückt durch den Korrelationskoeffizienten cor(ξi, ξu). Unter Voraussetzung eines Netzwerks der Komponenten mit rein linearer Wechselwirkung der Komponenten untereinander und ohne Streuung sollte die Steigung r für alle Komponenten konstant sein.
  • Aus den Gleichungen (IV) bzw. (V) ergibt sich, dass der Vektor ξi für Komponenten mit hohen Werten des Parameters xii zu dem Vektor ξu hochkorreliert sein sollte. Der Vektor ξu ist die verbleibende, nicht aus der Bestimmung der Aktivitätsänderung der Komponenten messbare Größe. Obwohl ξu unbekannt ist ergibt sich, dass der Vektor ξi für Gruppen von Komponenten mit ähnlichen Werten von xii in einem "Winkel" um ξu orientiert ist, wobei der Kosinus des Kegelwinkels durch den Parameter cor(ξi, ξu) gegeben ist. Der Parameter ξu ist unbekannt, da der Vektor ξi der einzelnen Komponenten eine verschiedene Korrelation zu dem Vektor ξu aufweist.
  • Die Bestimmung der Änderung der Aktivität der Komponenten gibt die Änderung der Aktivität für jede Komponente i und somit den Parameter xi an, sowie die Standardabweichung σi der Komponente i.
  • Die Standardabweichung σi wird bei der Erstellung des Modells aus mehreren Messungen bestimmt. Vorzugsweise werden hierzu wenigstens zwei biologische Systeme, vorzugsweise wenigstens drei, bevorzugt wenigstens vier biologische Systeme, vorzugsweise ausgewählt aus der Gruppe umfassend Zelle, Zellkultur, Gewebe, Organ und/oder Organismus bereitgestellt und das Verfahren insbesondere die Schritte (a) bis (g) in den bereitgestellten Systemen durchgeführt. Aus den erhaltenen Messdaten der Änderung der Aktivität der Komponenten, beispielsweise der Änderung der Genexpression, nach der verwendeten reversiblen Störung ist dann die Standardabweichung σi für die Komponente i berechenbar.
  • Von besonderem Vorteil ist hierbei, dass die Standardabweichung σi für die Komponente i anhand der verwendeten Störung in einem System bestimmt wird, und nachfolgend bei der Anwendung des Modells für anderer Störungen des Systems verwendbar ist.
  • Von weiterem Vorteil ist hierbei, dass die einmal bestimmte Standardabweichung σi für die Komponente i erlaubt, das erfindungsgemäße Verfahren für eine andere Störung der Komponente i in dem verwendeten System zu verwenden, ohne dass σi erneut zu bestimmen ist. Vorteilhafter Weise ist das Verhalten eines Netzwerks umfassend Komponenten bekannter Standardabweichung σ für die Komponenten aus den in Schritten (c) und (e) bestimmten Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks vor und nach Ausüben der reversiblen Störung bestimmbar.
  • Somit ergibt sich der Vektor ξi für alle Komponenten i und die Gleichung (V) erlaubt die Berechnung von σu ξu. Diese Berechnung kann mittels Optimierungsverfahren durchgeführt werden. Geeignete Optimierungsverfahren sind beispielsweise alle Verfahren der Kombinatorischen Optimierung, beispielsweise ausgewählt aus der Gruppe umfassend Genetische Algorithmen und/oder das Simulierte Ausglühen oder "Simulated Annealing". Geeignete Genetische Algorithmen sind beispielsweise beschrieben in Ingo Rechenberg, Evolutionsstrategie '94, Frommann Holzboog, 1994.
  • Die Berechnung von ξu kann insbesondere unter der Voraussetzung, dass |u| wie auch ξu näherungsweise konstant in einem biologischen System sind, berechnet werden.
  • Die Rekonstruktion von ξu aus den Daten der bestimmten Änderung der Aktivität der Komponenten setzt voraus, dass die Gleichung (V) in ein überbestimmtes lineares Gleichungssystem überführt wird.
  • ξu wird vorzugsweise durch kombinatorische Optimierung bestimmt, wobei ein bevorzugter Algorithmus der sogenannte genetische Algorithmus ist. Dieser ist beispielsweise beschrieben in Ingo Rechenberg, Evolutionsstrategie '94, Frommann Holzboog, 1994. Weitere geeignete Optimierungsverfahren, die die Berechnung von ξu aus den bestimmten Daten der Änderung der Aktivität der Komponenten erlauben, sind beispielsweise ausgewählt aus der Gruppe umfassend Simulierte Ausglühen oder "Simulated Annealing" genannt und/oder Sintflut-Algorithmus oder "Grand Deluge" genannt.
  • Vorzugsweise wird ξu in Form einer linearen Kombination aus den bestimmten Daten der Änderung der Aktivität der Komponenten für eine gewählte Anzahl Komponenten bestimmt. Die Anzahl der Komponenten, die für eine solche Bestimmung benutzt werden, kann vorzugsweise im Bereich von 1 bis 4.000 Komponenten, bevorzugt im Bereich von 5 bis 100 Komponenten liegen.
  • Aus der Anzahl Komponenten kann eine geeignete Untergruppe an Komponenten, beispielsweise Su benannt, beispielsweise mit einer Anzahl Komponenten im Bereich von ≥ 10 Komponenten bis ≤ 4000 Komponenten, vorzugsweise im Bereich von ≥ 20 Komponenten bis ≤ 200 Komponenten verwendet werden, um die statistische Gewichtung wi für eine lineare Kombination gemäß der folgenden Gleichung (VI):
    Figure 00200001
    worin:
  • ξu'
    ist der optimierte formale Vektor des biologischen Rauschens an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt,
    wi
    ist die statistische Gewichtung der Komponenten,
    ξi
    ist der Vektor der Verschiebung der i-ten Komponente als Reaktion auf das Rauschen um den Mittelwert der Aktivität der Komponente i, beispielsweise der Expression des Gens i, im stratifizierten System,
    zu berechnen. Die berechnete Gewichtung wi erlaubt die Berechnung der linearen Korrelationskoeffizienten der Gleichung (V) wie auch die der weiteren Parameter der Gleichung. Die erhaltenen Werte können dazu benutzt werden den genetischen Algorithmus und eine optimale Anzahl Komponente zur Optimierung von ξu zu bestimmen. Diese Optimierung ist vorzugsweise Teil der verwendbaren Optimierungsverfahren.
  • Unter Verwendung des optimierten ξu' ist die Gleichung (V) bzw. (IV) für alle Komponenten berechenbar.
  • Das erfindungsgemäße Verfahren erlaubt somit das Verhalten eines biologischen Netzwerks zu berechnen anhand von experimentell erhältlichen Daten der Änderung der Aktivität der einzelnen Komponenten des Netzwerks. Von besonderem Vorteil ist hierbei, dass eine solche Berechnung auch bei einer sehr großen Anzahl an Komponenten anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des Netzwerks ermöglicht ist, wobei unter Berücksichtigung der Biodiversität der Reaktion der Komponenten eine Berechnung ermöglicht wird, ohne dass inner halb des bereitgestellten linearen Modells eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf eine Störung beschreiben, explizit berechnet werden muss.
  • In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens ist die Biodiversität eine biologische Variation ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktion eines Systems auf Umgebungsfaktoren, die es erlaubt, das bereitgestellte lineare Modell mit Hilfe der durch die Biodiversität erzeugten Variationen ohne systematische Experimente zu bestimmen.
  • Dies stellt einen besonderen Vorteil des erfindungsgemäßen Verfahrens zur Verfügung mit dem das Verhalten eines Netzwerks vieler Komponenten beispielsweise einer großen Anzahl von Genen, wie sie beispielsweise als Reaktion auf einen toxischen Stress reguliert werden können, zu bestimmen, ohne dass systematische Experimente durchgeführt werden müssen.
  • Insbesondere ermöglicht das erfindungsgemäße Verfahren, dass durch Bereitstellen eines biologischen Systems, Ausüben einer Störung auf dieses System, und einer einmaligen Bestimmung der Änderung der Aktivität der Komponenten auf die reversible Störung das Verhalten anhand des bereitgestellten linearen Modells beschrieben werden kann.
  • Eine Störung kann beispielsweise ein Stress sein, der auf das System wirkt. Vorzugsweise ist die Störung ein externer Stress, bevorzugt ausgewählt aus der Gruppe umfassend toxischer Stress, vorzugsweise ausgewählt aus der Gruppe umfassend Stress durch nicht-genotoxische oder gentoxische Hepatokarzinogene, Wärmestress, Stress durch Hunger, Stress durch Applikation eines pharmazeutischen Wirkstoffs, einer Chemikalie und/oder eines Medikaments.
  • Bevorzugte biologische Systeme sind ausgewählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismus, wobei bevorzugte Gewebe oder Organe solche sind, die biologische und/oder biochemische Komponenten enthalten. Bevorzugte Gewebe oder Organe sind beispielsweise ausgewählt aus der Gruppe umfassend Gehirn und/oder Leber. Es versteht sich, dass jedes biologische System im Rahmen der vorliegenden Erfindung verwendet werden kann, beispielsweise prokariotische wie eukariotische Zellen oder Organismen. Ein biologisches System kann beispielsweise eine Zellkultur sein oder ein Säugetierorganismus wie Maus oder Ratte, die durch geeignete experimentelle Ausführung einer reversiblen Störung ausgesetzt werden können.
  • Bevorzugte biologische Komponenten sind Gene. Insbesondere die Untersuchung der Genexpression ist Gegenstand weitläufiger Untersuchungen zur Reaktion von biologischen Systemen auf eine Störung bzw. Stress. Bevorzugte biochemische Komponenten sind ausgewählt aus der Gruppe umfassend RNA, DNA, Metaboliten und/oder Proteine.
  • Biologische und/oder biochemische Komponenten können auf eine reversible Störung reagieren, indem sie ihre Aktivität ändern. Abhängig von der Art des Stresses und der hierdurch beeinflussten Komponenten und/oder der Stärke der ausgeübten Störung werden unterschiedliche biologische und/oder biochemische Komponenten durch eine solche Störung beeinflusst. Durch eine solche Störung können abhängig von der Art und des Ausmaßes der Störung viele oder wenige Komponenten eines Netzwerks beeinflusst werden. Die Anzahl der Komponenten, die durch eine Störung direkt betroffen werden kann in weiten Bereichen variieren, beispielsweise in einem Bereich von ≥ 1 Komponente bis alle Komponenten, entsprechend ≤ 100 % der Komponenten, bezogen auf 100 % Komponenten, bevorzugt im Bereich bis ≤ 20% der Komponenten, bevorzugter im Bereich bis ≤ 10 % der Komponenten, vorzugsweise im Bereich bis 5 % der Komponenten, auch bevorzugt im Bereich bis ≤ 3 % der Komponenten, noch bevorzugt im Bereich bis ≤ 2 % der Komponenten, bezogen auf 100 % der Komponenten, liegen.
  • In weiterhin bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann eine Störung auf die Änderung der Aktivität aller Komponenten berechnet werden, solange ihre Aktivität vorzugsweise ihre Expression hinreichend genau gemessen werden kann. Die hinreichend genau bestimmbare Anzahl der Komponenten beispielsweise bei Genexpressionsnetzwerken liegt im Bereich bis 40 % der Komponenten, vorzugsweise im Bereich bis 30 % der Komponenten, bezogen auf 100 % der Komponenten. Es ist ein besonderer Vorteil des erfindungsgemäßen Verfahrens, dass die grobe Berechnung des Verhaltens eines Netzwerks auch dann noch ermöglicht wird, wenn mehr als 30 % der Komponenten eines Netzwerks, insbesondere wenn mehr als 40 % der Komponenten eines Netzwerks von der reversiblen Störung betroffen sind.
  • Die Aktivität der biologischen oder biochemischen Komponenten des Netzwerks kann hierbei in Abhängigkeit von der reversiblen Störung ebenfalls in einem variierenden Ausmaß beeinflusst werden. In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens ist die Aktivität der Komponenten in einem Bereich von 0,1 % bis 30 %, bevorzugt 0,5 % bis 25 %, vorzugsweise 1 % bis 20 %, noch bevorzugter 5 % bis 15 % bezogen auf die Aktivität der biologischen oder biochemischen Komponenten im Grundzustand, d.h. in einem Zustand bevor oder das keine Störung auf das System ausgeübt wird, beeinflusst.
  • Das erfindungsgemäße Verfahren ist in bevorzugten Ausführungsformen ein Verfahren in dem Gebiet der quantitativen Toxikogenomik. In bevorzugten Ausführungsformen sind die biochemischen oder biologischen Komponenten entsprechend Gene und RNA- und/oder DNA-Moleküle. Im Rahmen der vorliegenden Erfindung bedeutet Änderung der Aktivität eines Gens vorzugsweise, dass ein solches Gen in seiner Expression hoch- oder runter-reguliert wird. Die Expressionsrate eines Gens ist vorzugsweise als Gehalt an RNA oder dem entsprechenden Genprodukt bestimmbar. In besonders bevorzugten Ausführungsformen wird der in dem entsprechenden System, vorzugsweise einer Zellkultur oder Zellen eines Gewebes vorliegende RNA-Gehalt bestimmt.
  • Bevorzugt wird die Änderung der Aktivität mindestens einer biologischen oder biochemischen Komponente entsprechend mittels Verfahren bestimmt, die Auskunft über die in einem System vorliegenden RNA- oder DNA-Gehalt geben können, vorzugsweise aus der Gruppe umfassend semiquantitative RT-PCR, Northern Hybridisierung, Differential display, substraktive Hybridisierung, subtrahierte Bibliotheken, cDNA Arrays und/oder Oligo-Arrays.
  • In anderen bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann die biochemische Komponente ein Protein sein, oder ein Metabolit einer Wirksubstanz, die als Störung verabreicht wurde.
  • Es kann entsprechend weiterhin bevorzugt sein, dass man die Änderung der Aktivität einer Komponente mittels Verfahren bestimmt, die ausgewählt sind aus der Gruppe umfassend Verfahren, die zur Bestimmung eines Proteingehalts eines Systems verwendbar sind, vorzugsweise ausgewählt aus der Gruppe umfassend Western Hybridisierung, ELISA–Technik (Enzyme Linked Immuno Sorbent Assay) und/oder spektroskopische Methoden, beispielsweise HPLC (High Pressure Liquid Chromatography), fluroeszenzbasierte absorptive oder massenspektrometrische Nachweise.
  • In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann man zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells vergleichen, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderungen der Aktivität der biologischen oder biochemischen Komponenten besteht. Ergibt ein solcher Vergleich, dass eine Übereinstimmung zwischen der bestimmten Änderung der Aktivität einer Komponente und der entsprechenden Berechnung durch das bereitgestellte Modell besteht, entsprechend also eine Übereinstimmung vorzugsweise experimentell bestimmter Daten und der Berechnung des Modells besteht, unterliegt die experimentell bestimmte Reaktion der Komponente auf die Störung den Vorhersagen des Modells.
  • In anderen Ausführungsformen der erfindungsgemäßen Verfahren kann bei einem solchen Vergleich entsprechend Schritt (h) des Verfahrens feststellbar sein, dass eine statistisch signifikante Abweichung einer oder mehrerer Komponente(n) der gemäß Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente(n) im Netzwerk vorliegt, die anzeigt, dass diese Komponente(n) nicht dem bereitgestellten linearen Modell unterliegt. Eine solche Komponente, die dem bereitgestellten linearen Modell nicht unterliegt, kann ein Indikator für einen störungsinduzierten Übergang in einen neuen Zustand der Komponente sein und einen solchen Übergang anzeigen. Eine solche Abweichung von dem durch das bereitgestellte lineare Modell berechneten Verhalten, kann insbesondere bedeuten, dass die Störung für die Komponente nicht reversibel ist. Bei einer nicht reversiblen Störung kehrt das System nach Entfernen des Stresses nicht in seinen Ausgangszustand zurück, und/oder eine einzelne Komponente kehrt nach Entfernen der Störung nicht in den Ausgangszustand der Aktivität vor der reversiblen Störung zurück. Eine solche Komponente kann als Indikator dafür dienen, dass das System in einen anderen Zustand des biologischen Systems übergegangen ist, beispielsweise in einen Zustand, der einer Erkrankung verursacht durch die Störung entspricht.
  • Es ist ein Vorteil des erfindungsgemäßen Verfahrens, dass eine feststellbare statistisch signifikante Abweichung einer oder mehrerer Komponenten eine Aussage darüber ermöglicht, ob das System eine oder mehrere Komponenten aufweist, die anzeigen können, dass das System nach der ausgeübten Störung nicht reversibel reagiert, sondern einen davon abweichenden Zustand, vorzugsweise einen Zustand, der eine Erkrankung des Systems charakterisiert, einnimmt.
  • Die bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens bestimmt man die statistische Signifikanz mittels eines Signifikanztests vorzugsweise ausgewählt aus der Gruppe umfassend T-Test, Z-Test, und/oder chi-Quadrat-Test.
  • In weiteren Ausführungsformen des Verfahrens kann man in einem weiteren Schritt erhalten, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente im Netzwerk vorliegt.
  • Der Abstand von einem direkten Angriffspunkt der Störung ist erhältlich durch den Korrelationskoeffizienten cor(ξi, ξu). Je größer der Absolutbetrag ist, desto dichter ist die Komponente am Angriffspunkt.
  • Eine solche statistisch signifikante Isolation der Aktivität einer oder mehrerer Komponenten kann bedeuten, dass diese Komponente dicht am mechanistischen Angriffspunkt der Störung liegt. Eine solche Komponente, die signifikant stärker durch die ausgeübte Störung in ihrer Aktivität reguliert wird, weist eine hohe Sensitivität gegenüber der Störung auf. Eine solche signifikant regulierte Komponente kann eine Komponente, beispielsweise ein Gen, sein, die mit einem entsprechenden Berechnungsverfahren zur Berechnung nicht direkt beobachtbare Größe, beispielsweise physiologische Änderungen eines Organismus, einen Biomarker ausbilden.
  • In einer weiteren bevorzugten Ausführungsform des Verfahrens kann dieses zur Bestimmung von Biomarkern dienen.
  • In einer weiteren bevorzugten Ausführungsform des Verfahrens können die Schritte (a) bis (h) für wenigstens zwei reversible Störungen und optional wenigstens zwei Systeme wiederholt werden und man erhält in einem weiteren Schritt des Vergleichs, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente in Bezug auf verschiedene Arten von Störungen vorliegt, die eine Klassifikation der Störung anhand des Auftretens der statistisch signifikanten Regulation der Komponente(n) erlaubt.
  • Vorzugsweise ist feststellbar, dass wenigstens eine der bestimmten Komponenten in Bezug auf eine bestimmte Art von Störung einer statistisch signifikante Regulation aufweist, und in Bezug auf weitere Arten von Störungen davon statistisch signifikant verschiedene Regulationen aufweist, so dass eine statistisch signifikante charakteristische Reaktion auf eine bestimmte Störung feststellbar ist. Eine solche statistisch signifikante Regulation wenigstens einer Komponente auf eine bestimmte Störung erlaubt es, die Störung anhand des Auftretens einer solchen als Biomarker bezeichneten Komponente zu klassifizieren. Das Erhalten eines solchen Biomarkers kann in bevorzugten Ausführungsformen des Verfahrens unter Bestimmung der Änderung der Aktivität wenigstens einer Komponente und der Berechnung des Verhaltens des Netzwerks, dem diese Komponente angehört, entsprechend dem zur Verfügung gestellten linearen Modell zur Verfügung gestellt werden.
  • In bevorzugten Ausführungsformen erhält man eine statistisch signifikante Regulation der Aktivität mehrerer Komponenten, wobei eine solche Regulation eine positive oder negative Regulation, beispielsweise in Bezug auf die Expressionsrate von Genen eine Auf- oder Abregulation der Genexpression, sein kann. Die statistisch signifikante Regulation mehrerer Komponenten ist nicht notwendigerweise gleichgerichtet, sondern kann vorzugsweise eher einem charakteristischen Muster der Regulation der verschiedenen Komponenten entsprechen.
  • Vorteilhafterweise ermöglicht das erfindungsgemäße Verfahren in bevorzugten Ausführungsformen, dass eine große Anzahl von Komponenten durch das Modell berechenbar ist. In weiterhin vorteilhaften Ausführungsformen des Verfahrens ermöglicht das Verfahren weiterhin, dass die Berechnung auf möglichst wenige Komponenten beschränkbar ist. Dies ermöglicht das erfindungsgemäße Verfahren vorteilhafterweise dadurch, dass man eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponenten und der berechneten Änderung des Verhaltens des Netzwerks ermöglicht, dass die signifikant geregelten Komponenten über ihre signifikante Regulation durch eine bestimmte Störung erlauben, diese Störung beispielsweise in weiteren oder wiederholten Verfahren zu klassifizieren.
  • Das erfindungsgemäße Verfahren ist in bevorzugten Ausführungsformen ein Verfahren auf dem Gebiet der quantitativen Toxikogenomik. In bevorzugten Ausführungsformen des Verfahrens sind die Komponenten Gene und es wird die Genexpression vorzugsweise von Stressgenen bestimmt. Vorzugsweise ist das System ein Säugetier, beispielsweise eine Ratte oder Maus, das verschiedene Gewebe beispielsweise ausgewählt aus der Gruppe umfassend Leber und Gehirn umfasst, oder eine Zellkultur. Vorzugsweise wird eine externe Störung ausgeübt, indem ein reversibler toxischer Stress auf das System ausgeübt wird. Bevorzugt wird wenigstens ein, vorzugsweise mehrere pharmazeutischer Wirkstoff, vorzugsweise wenigstens ein Karzinogen appliziert. Es können in mehreren bereitgestellten Systemen mehrere pharmazeutische Wirkstoffe oder andere Chemikalien, vorzugsweise Karzinogene, bevorzugt ausgewählt aus der Gruppe umfassend Wirkstoffe, die einen nicht-genotoxischen Stress, genotoxischer Stress und/oder hepatotoxischer Stress ausüben, appliziert werden.
  • In einer besonders bevorzugten Ausführungsform des Verfahrens betrifft das Verfahren die Bestimmung der Änderung der Genexpression in einem Gewebe nach einem reversiblen toxischen Stress umfassend die folgenden Schritte:
    • (a) Bereitstellen eines Organismus, der ein Gewebes enthält, das ein biologisches Netzwerk umfassend eine Vielzahl von Genen umfasst;
    • (b) Bereitstellen eines linearen Modells zur Beschreibung der Änderung der Genexpression des Netzwerks;
    • (c) Bestimmen der Grundexpression der Gene;
    • (d) Ausüben eines toxischen Stresses, bevorzugt Applikation eines pharmazeutischen Wirkstoffs, vorzugsweise eines Karzinogens, wobei eine Änderung der Genexpression erzeugt wird;
    • (e) Bestimmen der Genexpression nach Applikation des toxischen Stresses, bevorzugt des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens, sobald die Gene des Netzwerks die Reaktion auf den Stress vollzogen haben;
    • (f) Bestimmen der Änderung der Expression wenigstens eines Gens nach Ausüben des toxischen Stresses, bevorzugt Applikation des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens;
    • (g) Berechnen der Änderung der Genexpression aller Gene des Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks aus der bestimmten Änderung der Expression wenigstens eines Gens unter Berücksichtigung der Biodiversität der Änderung der Genexpression; und
    • (h) optional Vergleichen der gemäß Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens und der gemäß Schritt (g) berechneten Änderung der Genexpression der Gene des Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung berechneten Änderung der Genexpression mit den in Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens besteht.
  • In bevorzugten Ausführungsformen des Verfahrens ist das Karzinogen ausgewählt aus der Gruppe umfassend nicht-genotoxische, genotoxische und/oder hepatotoxische Karzinoge.
  • In bevorzugten Ausführungsformen des Verfahrens ist vorgesehen, dass man die Expression einer Anzahl Gene im Bereich von ≥ 1 Gen bis ≤ 25.000 Gene, vorzugsweise im Bereich von ≥ 1 Gene bis ≤ 15.000 Gene, bevorzugt im Bereich von ≥ 1 Gene bis ≤ 5000 Gene, besonders bevorzugt im Bereich von ≥ 2 Gene bis ≤ 1000 Gene, weiter vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 400 Gene, noch vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 200 Gene bestimmt.
  • Ein weiterer Gegenstand der vorliegenden Erfindung betrifft ein Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung eines oder mehrerer Schritte des Verfahrens, wenn das Programm auf einem Computer ausgeführt wird. Die Erfindung lässt sich vorteilhafterweise in einem oder mehreren Computerprogrammen zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens durchführen, wenn das Programm auf einem Computer ausgeführt wird. Ein weiterer Gegenstand der vorliegenden Erfindung betrifft somit ein Computerprogramm zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens, wenn das Programm auf einem Computer ausgeführt wird. Ein weiterer Gegenstand des Verfahrens betrifft ein Computersystem mit Mitteln zur Ausführung eines oder mehrerer Schritte des erfindungsgemäßen Verfahrens.
  • Wenn nicht anders ausgeführt, weisen die verwendeten technischen und wissenschaftlichen Ausdrücke die Bedeutung auf, wie sie gemeinhin von einem Durchschnittsfachmann in dem Gebiet, zu dem diese Erfindung gehört, verstanden wird.
  • Alle Veröffentlichungen, Patentanmeldungen, Patente und weiteren hier angegebenen Literaturangaben sind voll inhaltlich durch Bezugnahme aufgenommen.
  • Beispiele, die der Veranschaulichung der vorliegenden Erfindung dienen, sind nachstehend angegeben.
  • Berechnungen und Datenanalysen wurden unter Verwendung von Matlab, Mathworks, Waltham, USA, ausgeführt, wenn nicht anders angegeben.
  • Beispiel 1
  • Bestimmung der Genexpression in Rattenleber nach einem reversiblen toxischen Stress
  • Versuchsablauf, Behandlungsbedingungen und Probenaufbereitung erfolgte wie in "Ellinger-Ziegelbauer et al., Mutation Research 575, 2005 S. 61-84" beschrieben, sofern im folgenden nicht anders angegeben.
  • Für die in vivo Studien wurden männliche Wistar-Hanover-Ratten (Cr1:WI[G1/BRL/Han]IGS BR, Charles River Laboratories Inc, Raleigh, USA) in Versuchsgruppen von jeweils 5 Tieren eingeteilt und erhielten einmal täglich für einen Zeitraum von 1, 3, 7 oder 14 Tagen per Magensonde ("Gavage") jeweils eine der folgenden Substanzen in der angegebenen Konzentration. Verwendet wurden fünf genotoxische Karzinogene: 2-Nitrofluoren (Sigma, St. Louis, USA), in einer Konzentration von 4 mg/kg/Tag für 3 und 7 Tage, Dimethylnitrosamin (Sigma, St. Louis, USA), in einer Konzentration von 4 mg/kg/Tag für 3 und 7 Tage, Aflatoxin B1 (Sigma, St. Louis, USA), in einer Konzentration von 0,24 mg/kg/Tag für 3 und 7 Tage, N-nitrosomorpholin (TCI America, Portland, USA), in einer Konzentration von 3,5 mg/kg/Tag für 3 und 7 Tage, und CI Direct Black (TCI America, Portland, USA), 146 mg/kg/Tag für 3 und 7 Tage; fünf nicht-genotoxische Karzinogene: Methapyrilene HCl (Sigma, St. Louis, USA), in einer Konzentration von 60 mg/kg/Tag) für 3 und 7 Tage, Thioacetamid (Sigma, St. Louis, USA), in einer Konzentration von 19,2 mg/kg/Tag für 3 und 7 Tage, Diethylstilbestrol (Sigma, St. Louis, USA), in einer Konzentration von 10 mg/kg/Tag für 1 und 3 Tage, Wy 14643 (TCI America, Portland, USA), in einer Konzentration von 60 mg/kg/Tag für 1 und 3 Tage, und Piperonylbutoxid (Sigma, St. Louis, USA), in einer Konzentration von 1200 mg/kg/Tag für 1 und 3 Tage; sowie drei zusätzliche nicht-hepatotoxische Substanzen: Cefuroxim (Sigma, St. Louis, USA), in einer Konzentration von 250 mg/kg/Tag für 1, 3, 7 und 14 Tage, Nifedipin (Sigma, St. Louis, USA), in einer Konzentration von 3 mg/kg/Tag für 1, 3, 7 und 14 Tage, und Propranolol (Sigma, St. Louis, USA), in einer Konzentration von 40 mg/kg/Tag für 1, 3, 7 und 14 Tage.
  • Die Dosierungen der Karzinogene wurde so ausgewählt, dass ein Lebertumor lediglich unter der Bedingung einer langfristigen Verabreichung entsteht, so dass eine kurzfristige Verabreichung dieser Karzinogene in einem Bereich von 14 Tagen lediglich einen reversiblen toxischen Stress auf die Ratten ausübt. Für jede Verabreichungsgruppe wurde einer entsprechenden Gruppe von Kontrolltieren in gleicher Weise Lösemittel appliziert.
  • Nach den pro Substanz angegebenen Tagen der Applikation wurde jeweils die Gesamt-RNA der Leber von jeweils 3 gleichbehandelten Versuchstieren mittels RNAeasy 96 well-Kits (Qiagen) isoliert. Die Analyse der RNA Expression erfolgte mit der Affymetrix Gene Chip Microarray Plattform(Affymetrix Inc., Santa Clara, USA) nach einem Standardprotokoll ("GeneChip Sample Cleanup Module, Section 2: Eukaroytic Target Preparation, Affymetrix 701194 Rev.1, 2002). Die einzelnen Schritte sind im folgenden kurz beschrieben. 5 μg der Gesamt-RNA wurden wie vorgegeben mit dem cDNA Doppelstrang Synthese Kit, (Life Technologies, Karlsruhe) in doppelsträngige cDNA umgeschrieben. Von der gereinigten cDNA wurde anschließend in einer in vitro Transkriptionsreaktion mit dem ENZO Bio Array high Yield RNA transcript Labeling Kit, (Affymetrix Inc., Santa Clara, USA) biotinylierte copy-RNA (cRNA) hergestellt. Nach einer Fragmentierung wurden 15 μg der biotinylierten cRNA mit RAE230A Microarrays hybridisiert (Affymetrix Inc., Santa Clara, USA).
  • Nach der Hybridisierung für 16 Stunden wurden die Arrays entsprechend den Angaben des Herstellers gewaschen und mit Phycoerythrin-markiertem Streptavidin (Molecular Probes, Eugene, USA), gefärbt. Die Phycoerythrin-Fluoresezenz wurde anschließend in einem Agilent Gene Array Scanner (Agilent, Palo Alto, USA) gelesen.
  • Der RAE230A Microarray repräsentiert 15.866 sogenannte "Probe Sets". Diese entsprechen 14.280 rattenspezifischen Unigene Clustern, die wiederum größtenteils einzelnen Rattengenen entsprechen. Die vom Scanner ausgegebenen Rohdatenfiles (DAT) wurden mit Hilfe der Software Microarray Suite 5.0 (MAS5) der Firma Affymetrix durch Hintergrundkorrektur und Mittelung der Fluoreszenzwerte aller 36 pixels pro Oligonukleotid Set in CEL files umgewandelt. Danach erfolgte eine Qualitätskontrolle der Micorarrays mit der Software Expressionist Refiner der Firma Genedata AG (Basel, Schweiz). Diese kann Fluoreszenzgradienten und helle oder dunkle Flecken pro Microarray erkennen und korrigieren. In den CEL files wird ein "Probe Set" durch 11 Paare von "Perfect Match (PM)" und "Mismatch (MM)" Oligonukleotid Sets dargestellt, wobei in den MM Oligonukleotiden ein Nukleotid in der Mitte ausgetauscht ist, somit nicht mehr mit der passenden cRNA des durch das PM repräsentierte Gen hybridisieren kann, und damit ein Maß für eine unspezifische Hintergrundhybridisieung darstellt.
  • Im folgenden wurden dann die Intensitätswerte der einzelnen PMs und MMs pro "Probe Set" mit zwei verschiedenen Algorithmen zu einem Intensitätswert verrechnet. Diese Algorithmen, genannt MAS5 und GCRMA, führen zu etwas unterschiedlichen Intensitätswerten im Niedrig-Expressionsbreich. Die daraus resultierenden zwei Sets von Datenfiles, mit einem Intensitätswert pro "Probe Set" wurden dann wie im folgenden Beispiel beschrieben, eingesetzt.
  • Insgesamt wurden Microarrays von 138 Lebergewebeproben hybridisiert, wobei die Proben in Gruppen entsprechend Leberproben von Tieren, denen genotoxische Karzinogene (Gruppe 1), nicht-genotoxischen Karzinogene (Gruppe 2), nicht-hepatotoxischen Karzinogene (Gruppe 3) appliziert wurden, und den jeweiligen Kontrollen der Genexpression vor der Applikation des Karzinogens (Gruppe 0), eingeteilt wurden.
  • Beispiel 2
  • Berechnung der Änderung der Genexpression anhand des linearen Modells
  • Für die Erstellung des Modells wurden die mittels Affymetrix gemäß Beispiel 1 bestimmten 4.000 höchst exprimierenden Gene verwendet. Die Auswahl erfolgte, indem die mittlere Expression jedes Gens berechnet wurde und dann die 4000 Gene mit der höchsten mittleren Expression ausgewählt wurden. Diese Auswahl erfolgte, um Fehler in der Auswertung von Expressionsdaten bei niederen Expressionswerten zu vermeiden.
  • Für jedes der 4.000 Gene i wurde die logarithmische Expressionsrate xi einzeln berechnet.
  • Hierzu wurde für alle Daten, die mit Hilfe von GCRMA aus den Rohmessdaten gewonnen werden, der natürliche Logarithmus mit Hilfe von Matlab berechnet.
  • Weiterhin wurden die erhaltenen Daten für jedes Gen stratifiziert. Hierzu wurde für jedes Gen der Mittelwert der Expression für jede Substanzgruppe berechnet. Danach wurde für jedes Gen und jeden Expressionswert der jeweilige Mittelwert subtrahiert. Hierdurch wurde erreicht, dass nur noch die Schwankungen um den jeweils durch die Mittelwerte beschriebenen stationären Zustand order Steady state berücksichtigt wurden.
  • Bei der Bestimmung des jeweiligen stationären Zustands oder Steady State wurde für jedes Gen über jede Substanzgruppe 0, 1, 2 und 3 der Mittelwert berechnet.
  • Hierdurch wurde für jedes Gen i ein Wert xi, der die mittlere Verschiebung der Genexpression der i-ten Komponente als Reaktion auf den toxischen Stress wiedergibt, erhalten. Zusätzlich wurde für jedes Gen i und jede Gewebeprobe der stratifizierte Expressionswert ξi berechnet, indem von allen Expressionswerten des Gens i in den Geweben der Stressgruppe der Mittelwert der Expression des Gens i in dieser Gewebegruppe subtrahiert wurde. Diese Werte geben das Rauschen um den Mittelwert der jeweiligen Gruppe jeder Substanzgruppe 0, 1, 2 und 3 an. Dieses Rauschen wird zum einen von Messfehlern, zum anderen von der Biodiversität der Reaktion der Gene auf den jeweiligen toxischen Stress und zusätzliche, stochastisch schwankende Umweltbedingungen, erzeugt.
  • Aus den Werten ξi wurden je Gen die Standardabweichung σi über die verwendeten 138 Proben mit Hilfe von Matlab berechnet.
  • Aus bekannten Werten von der mittleren Verschiebung xi und σi wurde der Term xii für die Gene berechnet. Dieser Term gibt effektive Verschiebung der Genexpression der einzelnen Gene durch die Störung an.
  • Aus den erhaltenen Werten von xii für die 4000 Gene wurden die 100 höchst signifikanten Gene mit den höchsten Werten von xii ausgewählt.
  • Für diese 100 höchst signifikanten Gene wurden die Gewichte wi durch Optimierung mit Hilfe eine genetischen Algorithmus berechnet Diese Prozedur wird unten beschrieben. Aus diesen Gewichten wurde gemäß
    Figure 00320001
  • ξu berechnet und mit dem bekannten ξi wurde dann gemäß Gleichung (IV) der paarweise Korrelationskoeffizient cor(ξi, ξu) berechnet.
  • In der folgenden Tabelle 1 sind die Werte für xii und cor(ξi, ξu) exemplarisch für die 100 höchst exprimierten Gene angegeben:
    Gen-Nummer xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchstexprimierenden Gene Gen-Nummer xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchstexprimierenden Gene
    1 –0,8639 –0,2284 51 –1,6086 –0,1596
    2 –1,7449 –0,2937 52 –0,8255 –0,2469
    3 –0,3352 –0,1256 53 –1,2481 –0,1669
    4 –1,714 –0,1832 54 –1,7704 –0,2794
    5 –0,1267 0,054 55 –0,8749 –0,1012
    6 –1,1887 –0,1871 56 1,1776 0,204
    7 –0,5797 –0,0272 57 –1,4196 –0,2213
    8 –1,1887 –0,1375 58 –1,5482 –0,1247
    9 –0,9122 –0,0954 59 –1,2607 –0,1632
    10 –0,7818 –0,1221 60 –1,661 –0,249
    11 1,0403 0,1477 61 –3,182 –0,4786
    12 –0,621 –0,005 62 –0,5108 –0,1255
    13 –1,0258 –0,1489 63 0,3719 0,092
    14 –2,0452 –0,2533 64 1,6891 0,2705
    Gen-Numme xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchstexprimierenden Gene Gen-Nummer xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchst exprimierenden Gene
    15 –1,5043 –0,0387 65 –0,7853 –0,1772
    16 –1,8747 –0,2316 66 –0,0616 0,0251
    17 1,2427 0,0753 67 –1,6085 –0,2457
    18 –1,1158 –0,2487 68 –1,1772 –0,228
    19 –0,0269 0,0349 69 –1,8573 –0,202
    20 –1,5387 –0,2411 70 1,4588 0,2035
    21 –0,5044 0 71 –0,1823 0,0684
    22 1,4232 0,1759 72 0,2329 0,1671
    23 –1,2783 –0,1777 73 1,3752 0,1567
    24 –2,0932 –0,3754 74 –1,3919 –0,2328
    25 –1,9516 –0,261 75 –2,486 –0,3218
    26 –0,8018 –0,1673 76 –1,616 –0,2251
    27 –1,5668 –0,2338 77 –1,616 –0,2251
    28 –2,731 –0,2212 78 –0,1054 –0,0522
    29 –2,8363 –0,3401 79 1,1247 0,1754
    30 –1,0813 0,0704 80 –0,8774 –0,1094
    31 0,0119 –0,0596 81 –0,0144 0,0008
    32 0,964 0,1351 82 –1,709 –0,0839
    33 –1,1782 –0,0393 83 –1,8448 –0,2745
    34 –1,6021 –0,17 84 –2,8029 –0,2393
    35 –0,9161 –0,1772 85 1,712 0,3029
    36 –1,6307 –0,3445 86 0,8732 0,1756
    37 –0,634 –0,0916 87 –2,7089 –0,251
    38 –0,1102 –0,0148 88 –1,7333 –0,2831
    39 –0,1269 0,0543 89 –0,9931 –0,0826
    40 –1,9546 –0,3756 90 –0,9297 –0,0934
    41 –0,3329 0,0894 91 0,8024 0,1281
    42 0,1357 –0,1004 92 0,8872 0,066
    43 –0,33 0,1339 93 –1,0377 –0,1278
    44 –0,5336 –0,012 94 –0,3729 –0,1597
    45 –0,0215 –0,0694 95 –0,5099 –0,062
    Gen-Nummer xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchstexprimierenden Gene Gen-Nummer xii für die 100 höchstexprimierenden Gene cor(ξi, ξu) für die 100 höchstexprimierenden Gene
    46 0,5651 0,1144 96 1,3229 0,1239
    47 –0,456 –0,0907 97 –2,1548 –0,2142
    48 –1,5579 –0,2523 98 –2,1819 –0,3201
    49 –1,406 –0,2453 99 –0,3307 –0,032
    50 –1,6404 –0,2383 100 2,9326 0,4455
  • Die Berechnung von ξu erfolgte folgendermassen:
    Die Berechnungen wurden mit Hilfe der 4000 höchst exprimierenden Genen durchgeführt, wobei jeweils die 100 signifikantesten Gene als Trainingsdatensatz zur Berechnung der Parameter verwendet werden, die restlichen 3900 Gene als Testdatensatz zum Test der Modellqualität mit den erhaltenen Parametern.
  • Um die Stabilität des Modells zu verbessern, wurde nur ein Teil von ca. 30 Genen aus diesen 100 Gene für die Modellierung verwendet. Um diesen Teil optimal zu bestimmen, wurde unter Verwendung des genetischen Algorithmus der Vektor ξu optimiert, indem schrittweise diese Teilmenge an Genen mit Hilfe des genetischen Algorithmus so ausgewählt wurde, dass das Modell einen minimalen Fehler aufwies.
  • Die optimale Auswahl dieser Gengruppe erfolgte mit Hilfe eines genetischen Algorithmus wie in der Literatur beschrieben. Es wurden hierzu 20 Gengruppen mit je 20 Genen gebildet. Für jede Gengruppe wurden dann die Gewichte wi durch Auflösen der Gleichung (V) nach Einsetzen der Gleichung (VI) mit Hilfe der linearen Algebraroutinen von Matlab unter Benutzung der 100 höchst signifikanten Gene errechnet. Dann wurde für jede Gengruppe mit den berechneten Gewichten wi nach Gleichung (VI) bestimmt und mit Hilfe von Gleichung (V) und der oben genannten Formel für ξu die Vorhersagewerte für die übrigen 4000 Gene berechnet. Das mittlere Fehlerquadrat der Abweichung dieser Vorhersagewerte von den gemessenen Werten ergab das Maß für die Qualität des Modells, das durch die jeweilige Gengruppe bestimmt ist. Dann wurden wie bei genetischen Algorithmen üblich die 20 Gengruppen durch Rekombination und Mutation variiert und mit den variierten Gengruppen die Berechnung der Modellparamter und der jeweiligen Modellqualität erneut ausgeführt. Diese Prozedur wurde solange wiederholt, bis sich keine Verbesserung mehr erzielen ließ. Nach 200 Wiederholungen wurde keine signifikante Verbesserung der Prognosefähigkeit des Modells mehr erzielt.
  • Dieser optimierte Vektor ξu wurde dann verwendet, um gemäß der Gleichung (IV) die Änderung der Genexpression aller Gene des Netzwerks zu berechnen.
  • In der folgenden Tabelle 2 sind die Werte für ξu, das als Ergebnis der Optimierung erhalten wurde, für die 138 verwendeten Gewebeproben angegeben:
    Gewebe-Nummer Vektor ξu Gewebe-Nummer Vektor ξu Gewebe-Nummer Vektor ξu
    1 76,5569 47 36,0453 93 –18,4466
    2 –14,5742 48 –14,2015 94 –85,8512
    3 288,1599 49 145,4589 95 10,727
    4 11,1768 50 –160,644 96 –109,0306
    5 230,3513 51 77,3361 97 –43,5056
    6 191,2853 52 48,4672 98 89,0143
    7 188,1156 53 –40,5311 99 –116,9526
    8 291,1027 54 –74,2292 100 –102,3417
    9 224,6252 55 47,0955 101 –56,6384
    10 –53,294 56 –50,7783 102 –167,215
    11 –90,4583 57 –107,2944 103 9,239
    12 –294,7351 58 –459,4381 104 –42,8732
    13 274,2629 59 –581,0783 105 –68,8991
    14 –56,5562 60 116,1542 106 –72,9573
    15 –28,1301 61 177,4406 107 33,4551
    16 167,6595 62 149,8353 108 –30,4143
    17 –137,847 63 58,9269 109 –186,0175
    18 –77,9698 64 167,4023 110 –13,3843
    19 –54,7617 65 –59,1586 111 –25,0929
    20 –169,1818 66 –605,2145 112 –150,191
    21 –5,0533 67 316,2251 113 –186,7943
    22 15,2488 68 322,8739 114 16,8619
    23 –82,9799 69 –51,0424 115 79,3224
    24 –73,3627 70 245,5574 116 91,981
    25 –268,3438 71 66,4274 117 –172,7753
    26 –27,8142 72 42,202 118 –44,9154
    27 –31,3407 73 –21,7779 119 –46,1011
    28 –234,3951 74 91,325 120 136,5539
    Gewebe-Nummer Vektor ξu Gewebe-Nummer Vektor ξu Gewebe-Nummer Vektor ξu
    29 208,0049 75 –52,6885 121 94,5613
    30 98,5644 76 –57,2132 122 –121,9597
    31 –17,0821 77 –149,6873 123 –211,345
    32 3,8032 78 78,5563 124 –95,7291
    33 –1,7166 79 448,4771 125 23,3157
    34 13,7851 80 –185,6028 126 50,9724
    35 36,9275 81 –56,3119 127 198,6063
    36 –275,6066 82 113,9029 128 227,2184
    37 83,9284 83 183,2596 129 101,7276
    38 –7,4295 84 107,4858 130 29,5541
    39 –43,6217 85 128,9119 131 –62,2693
    40 77,6214 86 146,4095 132 119,2673
    41 –36,2371 87 –100,1825 133 –224,152
    42 30,5607 88 83,4926 134 153,3749
    43 0,5632 89 21,8313 135 341,7285
    44 –99,5823 90 –312,5623 136 126,7139
    45 –33,3024 91 78,934 137 –107,1419
    46 18,2819 92 –75,366 138 28,559
  • Dieser optimierte Vektor ξu wurde dann verwendet, um gemäß der Gleichung (IV) die Änderung der Genexpression der 4.000 Gene des Netzwerks zu berechnen.
  • Es zeigte sich, dass die mit dem bereitgestellten linearen Modell bestimmte Änderung der Genexpression aller Gene des Netzwerks eine gute Übereinstimmung mit den gemessenen Daten zeigt. So zeigte eine Auftragung von xii gegen cor(ξi, ξu) dass die durch die reversible Störung regulierten Gene, insbesondere durch die Störung durch nicht-genotoxische Kanzerogene, eine gute Übereinstimmung mit dem linearen Modell zeigten.
  • Es zeigte sich weiter, dass die Gene, die dicht am biologisch vermuteten Angriffpunkt lagen, tatsächlich einen hohen Korrelationskoeffizienten mit ξu hatten. Darüber hinaus zeigt es sich, dass keine signifikanten systematischen Abweichungen vom Modell auftraten, so dass die im Experiment verursachten Störungen durch nicht-genotoxische Kanzerogene keinen signifikanten nichtlinearen Anteil hatten und somit als reversibel klassifiziert werden konnten.

Claims (21)

  1. Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung umfassend die folgenden Schritte: (a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems; (c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks; (d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird; (e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben; (f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung; (g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks und der in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) des biologischen Netzwerks nach der reversiblen Störung, unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n); und (h) optional Vergleichen zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) besteht.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das bereitgestellte lineare Modell umfasst: – einen Vektor, der die Bestimmung der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung umfasst, – eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben, und – einen Vektor, der die Störung beschreibt.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Schritt des Berechnens des Verhaltens des biologischen Netzwerks beinhaltet, dass man eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben, durch eine n×n-Matrix beschreibt, wobei n der Anzahl der Komponenten entspricht.
  4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Matrix durch eine Projektion der Daten der Änderung der Aktivität auf ihre Eigenvektoren mit Hilfe der Korrelationskoeffizienten von Komponentenpaaren des biologischen Netzwerks beschreibt.
  5. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass der Vektor, der die Störung beschreibt, einen Rauschanteil aufweist, der die Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n) beschreibt.
  6. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Biodiversität eine biologische Variationen ist ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren, die es erlaubt, das Modell mit Hilfe der durch die Biodiversität erzeugten Variationen ohne systematische Experimente zu bestimmen.
  7. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Störung ein externer Stress ist, vorzugsweise ausgewählt aus der Gruppe umfassend toxischer Stresse, bevorzugt ausgewählt aus der Gruppe umfassend Stress durch nicht-genotoxische oder genotoxische Hepatokarzinogene, Wärmestress, Hunger, Stress durch Applikation eines pharmazeutischen Wirkstoffs, einer Chemikalie und/oder eines Medikaments.
  8. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man das biologische System auswählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismus.
  9. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die biologische Komponente ein Gen ist.
  10. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die biochemische Komponente auswählt aus der Gruppe umfassend RNA, DNA, Metabolit und/oder Protein.
  11. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Störung eine direkte Änderung der Aktivität einer Anzahl an Komponenten eines Netzwerks im Bereich von ≥ 1 Komponente bis alle Komponenten, entsprechend ≤ 100 % der Komponenten, bezogen auf 100 % Komponenten, bevorzugt im Bereich bis ≤ 10 % der Komponenten, vorzugsweise im Bereich bis ≤ 5 % der Komponenten, bezogen auf 100 % Komponenten, hervorruft.
  12. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente mittels Verfahren ausgewählt aus der Gruppe umfassend semiquantitative RT-PCR, Northern Hybridisierung, Differentialdisplay, substraktiver Hybridisierung, subtrahierten Bibliotheken, cDNA Arrays und/oder Oligo-Arrays bestimmt.
  13. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man in einem weiteren Schritt erhält, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente im Netzwerk vorliegt.
  14. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Schritte (a) bis (h) für wenigstens zwei reversible Störungen und optional wenigstens zwei Systeme wiederholt, und in einem weiteren Schritt des Vergleichs erhält, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente in Bezug auf verschiedene Arten von Störungen vorliegt, die eine Klassifikation der Störung anhand des Auftretens der statistisch signifikanten Regulation der Komponente(n) erlaubt.
  15. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man in Schritt (h) feststellt, dass eine statistisch signifikante Abweichung einer oder mehrerer Komponente(n) der gemäß Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente(n) im Netzwerk vorliegt, die anzeigt, dass diese Komponente(n) nicht dem bereitgestellten linearen Modell unterliegt.
  16. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die statistische Signifikanz mittels eines Signifikanztests vorzugsweise ausgewählt aus der Gruppe umfassend T-Test, Z-Test und/oder chi-Quadrat-Test bestimmt.
  17. Verfahren nach einem der vorherigen Ansprüche umfassend die folgenden Schritte: (a) Bereitstellen eines Organismus, der ein Gewebes enthält, das ein biologisches Netzwerk umfassend eine Vielzahl von Genen umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung der Änderung der Genexpression des Netzwerks; (c) Bestimmen der Grundexpression der Gene; (d) Ausüben eines toxischen Stresses, bevorzugt Applikation eines pharmazeutischen Wirkstoffs, vorzugsweise eines Karzinogens, wobei eine Änderung der Genexpression erzeugt wird; (e) Bestimmen der Genexpression nach Applikation des toxischen Stresses, bevorzugt des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens, sobald die Gene des Netzwerks die Reaktion auf den Stress vollzogen haben; (f) Bestimmen der Änderung der Expression wenigstens eines Gens nach Ausüben des toxischen Stresses, bevorzugt Applikation des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens; (g) Berechnen der Änderung der Genexpression aller Gene des Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks aus der bestimmten Änderung der Expression wenigstens eines Gens unter Berücksichtigung der Biodiversität der Änderung der Genexpression; und (h) optional Vergleichen der gemäß Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens und der gemäß Schritt (g) berechneten Änderung der Genexpression der Gene des Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung berechneten Änderung der Genexpression mit den in Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens besteht.
  18. Verfahren zur Bestimmung der Änderung der Genexpression in einem Gewebe nach Anspruch 17, dadurch gekennzeichnet, dass man die Expression einer Anzahl Gene im Bereich von ≥ 1 Gen bis ≤ 5.000 Gene, bevorzugt im Bereich von ≥ 2 Gene bis ≤ 1000 Gene, vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 400 Gene bestimmt.
  19. Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche, wenn das Programm auf einem Computer ausgeführt wird.
  20. Computerprogramm zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche, wenn das Programm auf einem Computer ausgeführt wird.
  21. Computersystem mit Mitteln zur Ausführung der eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche.
DE102006031979A 2006-07-11 2006-07-11 Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung Withdrawn DE102006031979A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102006031979A DE102006031979A1 (de) 2006-07-11 2006-07-11 Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung
US12/307,987 US20090326897A1 (en) 2006-07-11 2007-06-28 Method for determining the behavior of a biological system after a reversible perturbation
EP07764902A EP2041682A1 (de) 2006-07-11 2007-06-28 Verfahren zur bestimmung des verhaltens eines biologischen systems nach einer reversiblen störung
PCT/EP2007/005712 WO2008006469A1 (de) 2006-07-11 2007-06-28 Verfahren zur bestimmung des verhaltens eines biologischen systems nach einer reversiblen störung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006031979A DE102006031979A1 (de) 2006-07-11 2006-07-11 Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung

Publications (1)

Publication Number Publication Date
DE102006031979A1 true DE102006031979A1 (de) 2008-01-17

Family

ID=38564356

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006031979A Withdrawn DE102006031979A1 (de) 2006-07-11 2006-07-11 Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung

Country Status (4)

Country Link
US (1) US20090326897A1 (de)
EP (1) EP2041682A1 (de)
DE (1) DE102006031979A1 (de)
WO (1) WO2008006469A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6138793B2 (ja) * 2011-09-09 2017-05-31 フィリップ モリス プロダクツ エス アー ネットワークに基づく生物学的活性評価のためのシステムおよび方法
US10339464B2 (en) 2012-06-21 2019-07-02 Philip Morris Products S.A. Systems and methods for generating biomarker signatures with integrated bias correction and class prediction
JP6313757B2 (ja) 2012-06-21 2018-04-18 フィリップ モリス プロダクツ エス アー 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
US20060177827A1 (en) * 2003-07-04 2006-08-10 Mathaus Dejori Method computer program with program code elements and computer program product for analysing s regulatory genetic network of a cell
WO2006116622A2 (en) * 2005-04-27 2006-11-02 Emiliem Novel methods and devices for evaluating poisons

Also Published As

Publication number Publication date
US20090326897A1 (en) 2009-12-31
EP2041682A1 (de) 2009-04-01
WO2008006469A1 (de) 2008-01-17

Similar Documents

Publication Publication Date Title
Tamminga et al. Strategies for advancing disease definition using biomarkers and genetics: the bipolar and schizophrenia network for intermediate phenotypes
Williams et al. Joint multipoint linkage analysis of multivariate qualitative and quantitative traits. I. Likelihood formulation and simulation results
DE69827154T2 (de) Polymorphismuserkennung mit hilfe cluster-analyse
Doll et al. Dopaminergic genes predict individual differences in susceptibility to confirmation bias
Taylor et al. Etiology of the dimensions of anxiety sensitivity: A behavioral–genetic analysis
Rijsdijk et al. The genetic basis of the relation between speed-of-information-processing and IQ
DE60035196T2 (de) Verfahren zum Charakterisieren von biologischen Bedingungen, die kalibrierte Genexpressionsprofile verwenden
DE112005002331T5 (de) Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen
DE69535463T2 (de) Ersatz für Zielobjekte und verbesserte Referenzplatten
Walker et al. Human and animal evidence of potential transgenerational inheritance of health effects: An evidence map and state-of-the-science evaluation
DE102010038014A1 (de) Verfahren zur Charakterisierung einer Probe und eines Systems
DE10155600A1 (de) Nukleinsäure-Array
Benyamin et al. Large, consistent estimates of the heritability of cognitive ability in two entire populations of 11-year-old twins from Scottish mental surveys of 1932 and 1947
Claussnitzer et al. Gaining insight into metabolic diseases from human genetic discoveries
Stubbs et al. Maize stalk stiffness and strength are primarily determined by morphological factors
Bonasera et al. A novel method for automatic quantification of psychostimulant-evoked route-tracing stereotypy: application to Mus musculus
Holsapple et al. Dose response considerations in risk assessment—an overview of recent ILSI activities
DE10159262B4 (de) Identifizieren pharmazeutischer Targets
DE102006031979A1 (de) Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung
DE60013303T2 (de) Verfahren zum entfernen systematischer fehler und abweichungen und zum abschätzen zufälliger fehler in chemischen und biologischen testverfahren
EFSA (European Food Safety Authority) et al. Statement on the toxicological properties and maximum residue levels of acetamiprid and its metabolites
Knyspel et al. Comparing factor and network models of cognitive abilities using twin data
DE60023496T2 (de) Mathematische analyse für die schätzung von veränderungen des niveaus der gen-expression
Buescu et al. Growth rate, evolutionary entropy and ageing across the tree of life
Coker et al. Genetic structure of wild and domesticated grasscutters (Thryonomys swinderianus) from south-western Nigeria

Legal Events

Date Code Title Description
8130 Withdrawal