Un petit post pour vous parler de Ngram Viewer que Google a développé en marge de Google Books.
En décembre 2004, Google a proposé son service de consultation de livres numérisés et déjà à l’époque un grand nombre d’ouvrages issus de bibliothèques avaient été scannés. Qui sait combien de journaux, magazines, romans, essais, etc… sont désormais stockés numériquement dans les entrailles des serveurs Google, mais un échantillon de 5 millions de documents peut être considéré comme significatif.
Malheureusement, notre pauvre petit cerveau est bien incapable d’assimiler autant d’information… mais pas les algorithmes de data-mining concoctés par les équipes de Google Labs qui , après avoir compté tous les mots scannés, peuvent nous dire par exemple en quelle année le terme « fellation » était le plus souvent imprimé. Ne me demandez pas où je suis allé chercher cet exemple, j’essaye juste d’attiser votre curiosité
La vidéo suivante d’un quart d’heure vaut plus que milles mots dans un blog pour vous rendre moins sceptique quant à l’intérêt d’une telle initiative.
[youtube]http://www.youtube.com/watch?v=SdhJwLJcdsU[/youtube]
Bon, maintenant, il faudrait que je me décide à me remettre à lire un peu.