Dokumentfrequenz
Entspricht für ein Wort w der Anzahl der Dokumente in denen w mindestens einmal vorkommt. Dieses Maß wird sowohl in der Computerlinguistik (cf. TF/IDF; Salton and McGill, 1983) als auch in der Psycholinguistik verwendet (als contextual diversity; Adelman, Brown und Quesada, 2006).
Für case-insensitive-Dokumentfrequenz, siehe Dokumentfrequenz (klein) in der Tabelle Types (klein).
- Dokumentfrequenz
- absolut, normalisiert, Frequenzrang
- pro 10.000 Dokumente
- größer oder gleich, kleiner oder gleich
- -1