top

Korpus

Das Kollokationenwörterbuch ist ein korpusgestütztes Wörterbuch, dessen Daten primär durch die lexikographische Aufbereitung der Kookkurrenzanalyseergebnisse der folgenden Korpora gewonnen werden:

DWDS-Kernkorpus (http://www.dwds.de):
Ausgewogenes Korpus mit deutschsprachigen Texten des 20. Jahrhunderts im Umfang von rund 100 Millionen Textwörtern.

Schweizer Textkorpus (http://www.schweizer-textkorpus.ch):
Ausgewogenes Korpus mit deutschsprachigen Texten aus der Schweiz des 20. Jahrhunderts im Umfang von rund 20 Millionen Textwörtern.

Korpus C4 (http://www.korpus-c4.org):
Internationales Korpus mit deutschsprachigen Texten des 20. Jahrhunderts aus Deutschland, Österreich, Südtirol und der Schweiz

Die mengenmässig noch handhabbaren und aufgrund der Ausgewogenheit der zugrundegelegten Korpora sehr breit gefächerten Daten werden schliesslich in einem manuellen Analyseprozess auf die artikelrelevanten Daten reduziert und systematisiert. Hierfür kommen weitere vom Umfang deutlich grössere und zudem synchroner ausgerichtete Korpora wie das "Deutsche Referenzkorpus" (DeReKo) sowie das Korpus des Projekts "Wortschatz-Leipzig" zum Einsatz. Auf diese Weise werden veraltete Belege aus den diachronen Korpora des Deutschen, die sich über das ganze 20. Jahrhundert erstrecken, aussortiert und gegebenenfalls Aspekte des aktuellen Sprachusus eingebracht.