Webmonitor
Hinweis: Dieses Korpus ist erst nach Anmeldung recherchierbar.
Zur Einführung in die Webkorpora im DWDS …
Beschreibung
Das Korpus Webmonitor ist ein allgemeines Korpus aus prominenten Quellen, das täglich aktualisiert wird. Viele der meistgelesenen Internetseiten im deutschen Sprachraum zählen dazu, etwa aus Deutschland, Österreich, der Schweiz, Italien (Südtirol), Belgien (Ostbelgien), Luxemburg und Liechtenstein. Einige Orte werden aufgrund ihrer deutschsprachigen Leserschaft einbezogen, wie zum Beispiel Spanien (Mallorca).
Dabei stehen größere Nachrichtenportale sowie die Presse von überregionaler und regionaler Bedeutung im Fokus. Vielfältige politische Interessengruppen werden berücksichtigt, auch die Regenbogenpresse sowie Gratis- und Boulevardzeitungen sind im Korpus recherchierbar.
Weitere spezialisierte Webseiten mit einer breiten Leserschaft ergänzen die Sammlung, darunter Börsen-, IT-, Lifestyle- und Sport-Seiten, sowie Nachrichtenseiten von diversen Berufsgruppen, beispielsweise Apotheker- und Bauernzeitungen. Ferner werden Seiten zu beliebten Themenfeldern einbezogen, unter anderem Gesellschaft, Wissenschaft, Kultur (Literatur, Musik und Film), Mobilität (Verkehrsmittel), Natur und Outdoor.
Ein letzter Schwerpunkt sind offizielle Webpräsenzen von Behörden (unter anderem Seiten von Ministerien, Bundesländern, Großstädten und Kantonen) und prominenten Nichtregierungsorganisationen (NGOs).
Nutzung im DWDS
Definitionen und Trendwörter
Das Korpus enthält vor allem Texte, die bei den ausgewählten Quellen neu veröffentlicht wurden. Es ist also für jüngste Entwicklungen relevant und wird mit der Zeit an zeitlicher Tiefe gewinnen.
Mit diesem Korpus werden im DWDS jüngste Trends für die Zusammensetzung von Definitionen und Beispielsätzen beobachtet. Außerdem werden daraus Trendwörter auf der Basis von Frequenzinformationen ermittelt, mit denen Kandidaten zur Aufnahme ins Wörterbuch oder zur Bearbeitung von bereits existierenden Artikeln bestimmt werden können.
Regionalangaben
Über hundert Quellen, die explizite Regionalteile aufweisen, werden in linguistisch relevante Areale unterteilt. Damit können Regionalismen im Sinne der Regionalangaben im DWDS gezielt abgefragt werden.
Gebrauchshinweise
Dieses Korpus wächst kontinuierlich, daher sind inhaltliche Anpassungen über die Zeit erforderlich. Außerdem wird die Quellenauswahl von mehreren Faktoren beeinflusst.
- Schwund und Anpassungen: Einerseits können bestimmte Korpusquellen über die Zeit verschwinden (aufgrund von qualitativen Entscheidungen oder von Änderungen in externen Webseitenstrukturen); andererseits werden weitere Seiten zur Sammlung hinzugefügt, so dass das Korpus auch hinsichtlich seiner Themenvielfalt wächst.
- Verhältnis zur DWDS-Plattform: Falls bestimmte Quellen anderweitig akquiriert werden oder bereits in anderen DWDS-Korpora enthalten sind, werden sie beiseite gelassen.
- Politisch fragwürdige Seiten: Einige Seiten werden aufgrund ihrer relativ großen Leserschaft einbezogen, damit das ganze politische Spektrum im Korpus zu finden ist.
Weitere Informationen
Allgemeine Informationen zu den Webkorpora
- Einführung in die DWDS-Webkorpora
- Verarbeitung und Reproduzierbarkeit
- Publikationen und Zitierbarkeit
Korpusübersicht
N. B.: Die folgenden Links setzen einen Login im DWDS voraus:
- Quellenübersicht für dieses Korpus, nach Frequenz sortiert
- Zeitliche Verteilung der Tokens für dieses Korpus
Zusammenstellung und Nutzung des Monitorkorpus
- Automatische Entdeckung und Verarbeitung von aktuellen Texten
- Hinweise zum Download von Webseiten in großen Mengen
- Lexikographische Trends auf der Wortwarte