Exemple de corpus corrigé stg

En fait, il y a une probabilité supérieure à 0. Quelle est alors la probabilité que dans le nouveau corpus la fréquence du mot est y? Si, cependant, vous devez utiliser un corpus où de tels déséquilibres surviennent, il existe un moyen de remédier à ce problème. Votre G2 de 17. Cela pourrait être opérationnalisé en imaginant que vous compilez un autre corpus (avec des textes des mêmes registres! Cela peut être testé en utilisant le test de vraisemblance log. En supposant que votre premier corpus a 1 million mots, nous imaginons que vous compilez un autre corpus de 1 million mots et que vous trouviez le mot en question 20 fois dans ce corpus. Disons dans le corpus x le mot a une fréquence de 2 PMW et vous voulez savoir combien il est probable que dans la population, il est de 20 PMW. Compte tenu d`une fréquence x d`un mot dans un corpus, quelle est la probabilité que la vraie fréquence du mot dans la population est y? Oui, vous pouvez, et en fait c`est la seule chose que vous pouvez prétendre sur la fréquence du mot dans le corpus. Il est disponible sur http://www. Beaucoup de corpus (excepté les très grands) incluent seulement des parties des textes plus grands comme des romans (tels que 2 000 mots) pour contourner ce problème. À l`aide de la calculatrice de vraisemblance log, vous obtenez une probabilité de log (également appelé G2) de 17. Même si vous avez déjà reçu une bonne réponse, je tiens à souligner le papier 2008 Gries “dispersions et les fréquences ajustées dans les corpus” qui est en quelque sorte une lecture incontournable pour quiconque fait corpus linguistique. Dispersion_IJCL..