Für die primäre Zielgruppe des Kollokationenwörterbuchs, die Sprachlernenden, ist ein begrenzter aktiver Wortschatz anzunehmen. Sie werden Kollokationen mit seltenen Lexemen als Basis demnach seltener nachschlagen.
Das Kollokationenwörterbuch umfasst daher einen statistisch-empirisch ermittelten Basiswortschatz von 2000 Lemmata, der sich aus einer Schnittmenge der folgenden Werke bzw. Korpusdaten zusammensetzt:
Lübke, Diethard. 2002. Lernwortschatz Deutsch: Deutsch - Englisch : [Wortschatz für das neue Zertifikat Deutsch]. Ismaning: Hueber. [~3100 Lemmata]
Bock, Heiko (ed.). 2007 [1991]. Basic German Vocabulary. Berlin, München: Langenscheidt. [~4000 Lemmata]
Wiktionary-Grundwortschatz-Liste: http://de.wiktionary.org/wiki/Wiktionary:Projekt:Grundwortschatz_plus_Wiktionary_minimum [~1400 Lemmata]
Remanofsky, Ulrich. 2000. Zertifikatstraining Deutsch. Wortschatz. Ismaning: Hueber. [~2000 Lemmata]
Schnörch, Ulrich. 2002. Der zentrale Wortschatz des Deutschen: Strategien zu seiner Ermittlung, Analyse und lexikografischen Aufarbeitung. http://www.ids-mannheim.de/pub/laufend/studien/sds26.html .
Lemmaliste des Schweizer Textkorpus (nach Häufigkeit).
Wortlisten der häufigsten Wörter des Wortschatzportals Leipzig (Web Archive: https://web.archive.org/web/20160901193225/http://wortschatz.uni-leipzig.de/html/wliste.html).
IDS Mannheim: Korpusbasierte Wortgrundformenliste DeReWo, v-30000g-2007-12-31-0.1, mit Benutzerdokumentation, http://www.ids-mannheim.de/kl/derewo/ .
Da sich auch Lehr- und Lernmaterialien an Basiswortschätzen orientieren, ist auf diese Weise gewährleistet, dass der Wörterbuchinhalt und der Kenntnisstand von Sprachlernenden möglichst grosse Übereinstimmungen aufweisen.