Digitales Wörterbuch der deutschen Sprache

Wörterbuch der deutschen Gegenwartssprache (WDG)

Überblick

Einführung

Das Wörterbuch der deutschen Gegenwartssprache (WDG) wurde im Zeitraum von 1952 bis 1977 an der Deutschen Akademie der Wissenschaften (ab Oktober 1972: Akademie der Wissenschaften der DDR) in Berlin erarbeitet. Es umfasst über 4 500 Seiten in sechs Druckbänden und enthält ca. 120 000 Stichwörter, wovon ca. 90 000 in Artikeln beschrieben sind.

Nach einer knapp zehnjährigen Vorbereitungsphase erschien 1961 die erste Doppellieferung, 1964 der erste Band. Die weiteren fünf Bände wurden in erster Auflage (Bd. 2:) 1967, (Bd. 3:) 1969, (Bd. 4:) 1974, (Bd. 5:) 1976 und (Bd. 6:) 1977 veröffentlicht.

Schon während seines Erscheinens wurde das WDG zum Vorbild für neue gegenwartssprachliche Wörterbücher anderer Verlage. Das WDG versteht unter deutscher Gegenwartssprache „außer der so charakterisierten, heute geschriebenen und gesprochenen Sprache der bildungstragenden Schicht auch die Sprache der in unserer Zeit noch gelesenen, lebendigen deutschen Literatur der Vergangenheit“ (Vorwort zu Bd. 1, S. 04). Deshalb zählten zum Bestand der Quellen, die der Ausarbeitung der Wörterbuchartikel zugrunde lagen, nicht nur die wichtigsten Gegenwartsautoren des ganzen deutschen Sprachbereichs bis in die siebziger Jahre des 20. Jahrhunderts, sondern auch zahlreiche ältere Texte deutscher Autoren seit Lessing und Kant. Genauen Aufschluss hierüber gibt das alphabetische Verzeichnis der Quellen (Bd. 6, S. 4559–4579).

Die Vorbemerkung zum 4. Band erläutert eine den Herausgebern und den Autoren im Jahr 1970 auferlegte einschneidende Änderung der Konzeption des WDG: „Es wird vom 4. Band an den gesamten Wortschatz konsequent auf der Grundlage der marxistisch-leninistischen Weltanschauung darstellen. Das gilt für die Auswahl der Stichwörter, für die Bedeutungsangaben, die kommentierenden Bemerkungen und auch für die Auswahl der Beispiele“. Dieser Forderung entsprechende Änderungen von Stichwörtern, semantischen und anderen Angaben wurden durch den neuen Beirat des WDG (s. Bd. 4, Titelei) auch in den Neuauflagen älterer Lieferungen veranlasst. Bezogen auf den Gesamtwortschatz ist der Anteil ausgeprägt DDR-konformer Artikel jedoch vergleichsweise gering geblieben. Im Nachhinein gewinnen viele Stichwortansätze und die einschlägigen semantischen Auskünfte insbesondere der späteren Bände des WDG durch das deutliche Bekenntnis zur offiziellen Sprache der DDR nicht nur spezifischen Aussagewert, sondern auch geschichtliches (und lexikographiehistorisches) Interesse. Der Benutzer darf allerdings nicht außer Acht lassen, dass die offizielle Sprache der DDR – außer im engeren Bereich DDR-typischer Bezeichnungen – nicht ohne weiteres mit der wirklichen Sprache ihrer Bevölkerung gleichzusetzen ist.

Digitalisierung

Grundlage für die Digitalisierung war bis auf den ersten Band (3. Auflage 1967) die Erstausgabe des WDG. Zwischen Februar und November 2002 wurde das WDG durch das Trierer Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften im Volltext digitalisiert, von der DWDS-Projektgruppe nachstrukturiert und im März 2003 auf der DWDS-Webseite unter dem Namen Elektronisches Wörterbuch der deutschen Gegenwartssprache (eWDG) veröffentlicht. In den Folgejahren wurde das eWDG schrittweise weiter inhaltlich erschlossen und ausgezeichnet. Da das WDG nicht maschinell erstellt wurde und darüber hinaus viele Informationen nur implizit kodiert sind, wurden halbautomatische Verfahren mit manueller Nachkorrektur angewendet, um die Definitionen, Kompetenzbeispiele, Belege sowie die weiteren, z. B. grammatischen und pragmatischen, Angaben korrekt zu identifizieren und zu markieren.

Die Retrodigitalisierung des WDG, die als weitgehend abgeschlossen angesehen werden kann, hat zwei Entwicklungen ermöglicht:

  1. Das digitalisierte Original wurde weitestgehend formgetreu auf der Webseite des DWDS bereitgestellt.
  2. Durch eine Entkopplung des eWDG von der Printversion konnten die lexikografischen Informationen in eine Datenbank überführt werden. Diese werden seit 2009 kontinuierlich im DWDS-Wortinformationssystem überarbeitet und aktualisiert.

Ein kurzer Abriss der Geschichte des digitalen WDG (eWDG)

Februar 2002 bis November 2002

Die BBAW als Rechteinhaberin an den elektronischen Rechten des WDG vergibt den Auftrag zur elektronischen Erfassung des WDG an das Kompetenzzentrum der Universität Trier. Die verwendete Ausgabe entspricht bis auf den ersten Band (3. Aufl. 1967) der Erstausgabe. Das WDG wird zwischen Mai und Juli 2002 in China digital erfasst, von August und November nachkorrigiert und in XML gemäß den Empfehlungen der Text Encoding Initiative (TEI) vorstrukturiert (Ende Oktober 2002).

Dezember 2002 bis Februar 2003

Das Projekt „Digitales Wörterbuch“ übernimmt die Nachstrukturierung, Datenhaltung und elektronische Veröffentlichung des WDG. Die erste und wichtigste Korrektur besteht in der Nachstrukturierung aller Komposita des WDG, da die automatisch durchgeführte Vorstrukturierung in mehreren tausend Fällen zu falschen Komposita führte. Hintergrund dieser Problematik sind die eingebetteten Komposita, die im WDG nicht ausgeschrieben, sondern nur einmal als Präfix bzw. dann für jedes Kompositum als Suffix aufgeführt werden. Ein Hauptproblem für die „Rekomposition“ dieser Stichwörter stellt die Mehrfacheinbettung dar. Aus diesem Grunde wurden die automatisch generierten Komposita (etwa 30 000) noch einmal per Hand überprüft und der XML/TEI-Annotierung als Attribut @key des Elements <entry> hinzugefügt.

18. März 2003

Veröffentlichung der elektronischen Version des WDG auf der Website des Projekts DWDS. Die XML/TEI-Quelldaten werden dabei über Perl- und XSLT-Skripte in ein HTML-Format transformiert. Etwa 60 000 Artikel sind über die Maske abfragbar. Nimmt man die Komposita hinzu, so kommt man auf die Anzahl von 90 000 Artikeln.

Mai 2003

Das elektronische WDG wird an Leo angebunden. Jedem Nutzer von Leo steht somit das WDG als Nachschlagewerk zur Verfügung.

April 2005

Im Rahmen des Projekts PoM der Akademie wurde das Quellenverzeichnis des WDG (ca. 1 000 Werke) digital erfasst. Darüber hinaus wurde eine Verknüpfung aller Beispielsätze im Wörterbuch mit dem Quellenverzeichnis vorgenommen. Es ist dadurch möglich, von allen Siglen direkt zur entsprechenden Quellenangabe zu springen. Die WDG-Daten werden in der XML-Datenbank eXist vorgehalten. Somit sind komplexere, auf XQuery beruhende Anfragen an das WDG möglich.

Mai 2005

Weitere Annotierungen des WDG kommen hinzu. Das WDG enthält etwa 40 000 „dazu“-Komposita. Diese wurden halbautomatisch vorannotiert und dann noch einmal komplett per Hand nachkorrigiert bzw. in der XML/TEI-Annotierung als Attribut @key des Elements <entry> hinzugefügt. Die Anzahl der online abfragbaren Stichwörter erhöht sich dadurch um rund 40 000 auf insgesamt knapp 130 000 Stichwörter.

August 2005

1 956 Einträge (Derivationen, wie z. B. Radikalität ← radikal) des elektronischen WDG wurden annotiert und sind somit abfragbar. Zusätzlich wurden 3 765 derivierte Einträge mit ihren Simplizia verknüpft und sind damit einheitlich abfragbar, z. B. Raffinierung und raffinieren.

Mai 2006

Nach längerer Zeit mit Serverproblemen bei der WDG-Abfrage mit der XML-Datenbank eXist wurde zu einer einfacheren MySQL-Abfrage des DWDS zurückgekehrt. Für jedes der ca. 130 000 abfragbaren Stichwörter werden die Stellen des Wörterbuchs zurückgegeben, in denen das Stichwort erwähnt ist. Bedingt durch Querverweise kann ein Stichwort an bis zu sieben verschiedenen Stellen im WDG aufgeführt werden.

Juni 2006

An digitalen Quellen des WDG und der Abfrage wurden einige kleinere Korrekturen vorgenommen:

  • Alle Varianten, die im WDG in Klammern gesetzt sind, werden ausgeschrieben und sind somit explizit in der elektronischen Stichwortliste abfragbar. Ein Beispiel hierfür ist Geleis(e), welches nunmehr sowohl als Geleis wie auch Geleise abfragbar ist.
  • Mehrere hundert bezüglich der Groß-/Kleinschreibung ambig generierte Komposita werden disambiguiert. Beispielsweise findet man unter dem Stichwort Aal-, aal sowohl das Substantiv Aalfang wie auch das Adjektiv aalglatt. Für die elektronische Variante wurden diese als Aalfang aalfang bzw. aalglatt Aalglatt generiert. Unter Einsatz der TAGH-Morphologie wurden alle falschen Varianten (d. h. aalfang und Aalglatt) aus dem Stichwortbestand eliminiert.

2007–2009

Seit dem zweiten Halbjahr 2007 wurden sämtliche Wörterbuchartikel in eine stärker strukturierte Version transformiert. Die Bearbeitung des WDG erfolgt stets unter der Maßgabe der zeichengetreuen Rekonstruierbarkeit des ursprünglichen Druckbildes. Aus diesem Grund werden alle typografischen Auszeichnungen sowie vereinzelt auftretende Abweichungen davon annotiert. Offensichtliche Orthografiefehler werden berichtigt, aber ebenso im Original vorgehalten. Dadurch bleibt ein nachträglicher manueller Abgleich mit dem Original jederzeit möglich.

Die gesamte Wörterbuchstruktur wird über moderne XML-Schemabeschreibungen (Relax NG, Schematron) abgebildet. Die Erarbeitung dieser Schemata erfolgt aus zwei Gründen: Zum Einen wird dadurch die rekonstruierte Wörterbuchstruktur explizit gemacht – eine Arbeit, die für das WDG in dieser Detailgenauigkeit erstmalig erfolgt; zum Anderen stellen die Schemata sicher, dass (halb-)automatische Transformationen nicht zu Strukturfehlern führen können. Die verwendeten Beschreibungssprachen sind dabei mächtig genug, neben der Struktur einen Großteil der auftretenden lexikalischen Terminologie auf konsistente Verwendung hin zu überprüfen.

Auf der Grundlage der exakten Strukturabbildung in der nunmehrigen Version kann insbesondere der Skopus lexikalischer Angaben automatisch rekonstruiert werden. Dadurch können sogar feinste Lesartenabstufungen unterhalb der explizit nummerierten Ebenen dargestellt werden. Aus platzökonomischen Gründen verwendete textverdichtende Operationen (beispielsweise bei Flexionsendungen, Nennung grammatischer Eigenschaften, Stichwörtern) können korrekt expandiert und im Browser anschaulich dargestellt werden. In vielen Fällen geht die Strukturabbildung zudem mit einer feinkörnigen Typisierung einher. So werden beispielsweise Gebrauchsangaben nach ihren zugrundeliegenden Dimensionen (geografisch, zeitlich, stilistisch, Register und andere) unterschieden; grammatische Angaben generalisieren über teilweise bearbeiterspezifische terminologische Variationen (bspw. Pl. ungebräuchl. vs. Pl. selten vs. oft im Sg.). Dieses Vorgehen ermöglicht die gezielte Suche nach Phänomenen über sämtliche Artikel unabhängig von der jeweiligen Formulierung – nicht zuletzt im Rahmen späterer lexikografischer Arbeiten.

In diesem Zusammenhang erfolgte eine weitgehende Klassifikation und Typisierung von Angaben, die nicht aufgrund ihrer typografischen Darstellung im Druck einer bestimmten Klasse zuzuordnen sind. Weiterhin wurden einzelne Artikel an die generische Mikrostruktur angepasst, die von uns mangels Verfügbarkeit eines lexikografischen Manuals für dieses Wörterbuch rekonstruiert wurde. Diese feinkörnige Erschließung der Mikrostruktur der Wörterbuchartikel erlaubt die Anreicherung der Artikel um weitere Angaben (z. B. Neue Rechtschreibung, Aussprache) und die gezielte Abfrage und Präsentation einzelner Angaben (z. B. Beispiele, Belege und Zusammensetzungen).

Juli 2009

Präsentation der neuen Version2 der digitalen Version des WDG (eWDG2) auf der Webseite des DWDS. Seitdem werden nur noch einzelne Digitalisierungsfehler, die von Lexikographen oder von Benutzern gemeldet werden, korrigiert.

Autorinnen und Autoren

Die folgenden Autorinnen und Autoren haben an den sechs Bänden des Wörterbuchs mitgearbeitet.

Als Herausgeber für die Bände 1 bis 6 werden Ruth Klappenbach und Wolfgang Steinitz genannt.

Als Bearbeiter werden genannt:

  • für Band 1: R. Klappenbach und H. Malige-Klappenbach
  • für Band 2–4: R. Klappenbach, H. Malige-Klappenbach sowie G. Kempcke
  • für Band 5–6: G. Kempcke, R. Klappenbach, H. Malige-Klappenbach

Als Autoren der Artikel werden genannt:

  • für Band 1: Ch. Blumrich, I. Dymke, W. Hartung, D. Herberg, H.-J. Ilsmann, G. Kempcke, R. Klappenbach, K.-D. Ludwig, H. Malige-Klappenbach, E. Muhlak, J. Scharnhorst, R. Schnerrer, H. Sparmann, E. Tellenbach u. a.
  • für Band 2: Ch. Blumrich, E. Dückert, I. Dymke, D. Herberg, H.-J. Ilsmann, G. Kempcke, S. Ketzel, R. Klappenbach, K.-D. Ludwig, H. Malige-Klappenbach, J. Scharnhorst, J. Schildt, R. Schnerrer, H. Sparmann, E. Tellenbach
  • für Band 3: M. Becker, Ch. Blumrich, J. Dresel, E. Dückert, I. Dymke, G. Ginschel, D. Herberg, H. Käubler, G. Kempcke, S. Ketzel, R. Klappenbach, K.-D. Ludwig, H. Malige-Klappenbach, H. Petermann, M. Richter, J. Scharnhorst, J. Schildt, R. Schmidt, R. Schnerrer, H. Sparmann, E. Tellenbach
  • für Band 4: R. Baudusch, Ch. Blumrich, J. Dresel, E. Dückert, I. Dymke, G. Ginschel, G. Hagen, D. Herberg, E. Ising, H. Käubler, G. Kempcke, S. Ketzel, R. Klappenbach, K.-D. Ludwig, E. Mager, H. Malige-Klappenbach, H. Petermann, M. Richter, V. de Ruiter, J. Schildt, R. Schmidt, R. Schnerrer, H. Sparmann, E. Tellenbach, W. Wunderlich, K. Wunsch
  • für Band 5: R. Baudusch, Ch. Blumrich, E. Dückert, I. Dymke, G. Ginschel, G. Hagen, H. Käubler, S. Ketzel, R. Klappenbach, E. Mager, H. Malige-Klappenbach, M. Richter, V. de Ruiter, R. Schmidt, R. Schnerrer, H. Sparmann, E. Tellenbach, W. Wunderlich, K. Wunsch
  • für Band 6: Ch. Blumrich, E. Dückert, I. Dymke, G. Ginschel, G. Hagen, H. Käubler, G. Kempcke, S. Ketzel, R. Klappenbach, E. Mager, H. Malige-Klappenbach, H. Petermann, M. Richter, V. de Ruiter, R. Schmidt, H. B. Schumann, H. Sparmann, E. Tellenbach, W. Wunderlich, K. Wunsch

(Die Kreuze, die auf dem jeweiligen Titelblatt darauf hinwiesen, dass ein Mitarbeiter/eine Mitarbeiterin zwischenzeitlich verstorben war, sind hier nicht wiedergegeben.)

Es sei außerdem darauf hingewiesen, dass die Herausgeber im Vorwort zum ersten Band, in der Danksagung (S. 30 f.), auf weitere Personen hinweisen, die bei der Enstehung des Wörterbuchs hilfreich zur Seite standen.

Auf die namentliche Zuordnung von Artikeln oder Artikelstrecken zu einzelnen Bearbeitern wurde bei der Herausgabe dieses Wörterbuchs verzichtet.

Die einzelnen Lieferungen und Bände wurden in den Folgejahren mehrfach neu aufgelegt und dabei teilweise auch überarbeitet.

(viel benutzte) Bände des Wörterbuchs der deutschen Gegenwartssprache