TF-IDF est une méthode simple mais efficace pour mesurer l’importance d’un mot dans un document par rapport à un corpus. La fréquence d’un mot (TF) indique combien de fois il apparaît dans un document, tandis que l’inverse de la fréquence des documents (IDF) mesure combien de documents contiennent ce mot. Le produit des deux donne TF-IDF, une valeur qui met en avant les mots importants dans un document tout en réduisant l’importance des mots courants comme « le » ou « et ».
Pantopique(s) lié(s) :
IAinformationmot