Registrieren
dlexDB

Dokumentfrequenz

Entspricht für ein Wort w der Anzahl der Dokumente in denen w mindestens einmal vorkommt. Dieses Maß wird sowohl in der Computerlinguistik (cf. TF/IDF; Salton and McGill, 1983) als auch in der Psycholinguistik verwendet (als contextual diversity; Adelman, Brown und Quesada, 2006).

Für case-insensitive-Dokumentfrequenz, siehe Dokumentfrequenz (klein) in der Tabelle Types (klein).

Datentyp
Dokumentfrequenz
Untertypen
absolut, normalisiert, Frequenzrang
Basis für die Normalisierung
pro 10.000 Dokumente
Abfrageoperatoren
größer oder gleich, kleiner oder gleich
Nullwert
-1