View on GitHub

openlexicon

Access to lexical databases

Gougenheim 1.00

Le fichier gougenheim.tsv présente, pour 1064 mots, leur fréquence et leur répartition (nombre de textes dans lesquels ils apparaissent). Le corpus sur lequel, il est basé est un corpus de langue oral basé sur un ensembles d’entretiens avec 275 personnes. C’est donc non seulement un corpus de langue orale mais aussi de langue produite. Le corpus original comprend 163 textes, 312.135 mots et 7.995 lemmes différents. Cette base, publiée dans le livre L’élaboration du français fondamental, ne fournit pas les fréquences pour les mots de fréquences inférieures à 20.

Table: gougenheim.tsv

Les champs sont les suivants: mots, répartition, fréquence brute.

Auteurs

Cette base est tirée du livre _L’élaboration du français fondamental écrit par G. Gougenheim, P. Rivenc, R. Michéa et A. Sauvageot.

Je remercie les auteurs ci-dessus pour leur fabuleux travail.

Boris New

Online access Openlexicon