Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

Ici, on discute de sujets variés...
Avatar de l’utilisateur
Cogite Stibon
Messages : 3300
Inscription : 16 févr. 2012, 13:19

Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#1

Message par Cogite Stibon » 01 oct. 2020, 17:08

Pour éviter le hors sujet, je continue ici
Cogite Stibon a écrit : 01 oct. 2020, 09:20
A propos de votre discussion sur l'usage du "malgré que'", il y a un très bel outil de google qui permet de suivre l'évolution de l'usage d'un mot dans les livres :

https://books.google.com/ngrams/graph?c ... moothing=3
Nicolas78 a écrit : 01 oct. 2020, 15:37 Attend je comprend mal le graphique.
Est-ce que ca veux dire que, au meilleur de sa forme, "malgré-que" a été utilisé seulement dans 0,00015% des ouvrages en Français (répertoriés par Google) en 1813 ? Et qu'il a jamais fait mieux ? Ca crains sévèrement... Si c'est cela (je doute de bien comprendre le graphique).

Si oui, il reste que dans le langage populaire ca serait forcement bien plus élevé. Rien que si Google comptait ce forum, ca ferait grimper les stats en flèche :lol: La question (si j'ai bien compris le graphique), c'est : qui est dépositaire du bon gout dans la langue Française ? :a2:
Ça veut dire qu'il représentait 0,00015% des paires de mots présentes dans ces ouvrages. Plus d'info ici.
Pour les échantillons statistiques, comme dans d'autres domaines, il n'y a pas que la taille qui compte.
Raisonner a l'instinct sur des problemes de probabilites, c'est le desastre assuré. (Spin Up)
Une graphe sans échelle, c'est bon pour la poubelle

thewild
Messages : 3301
Inscription : 09 août 2016, 16:43

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#2

Message par thewild » 01 oct. 2020, 23:01

Bonne idée Cogite.

Ca m’interpellais qu'ils parlent de n-gramme à propos de groupes de mots et non de lettres, mais on lit ici : "En traitement du langage naturel il est fréquent de parler de N-gramme pour désigner des séquences de mots et non de lettres."
Sachant que le cœur de métier de Google c'est le traitement du langage naturel, il est tout à fait logique qu'ils utilisent cette terminologie.
"Assurons nous bien du fait, avant de nous inquiéter de la cause." Bernard Le Bouyer de Fontenelle

"Plus un fait est extraordinaire, plus il a besoin d'être appuyé de fortes preuves." Pierre Simon Laplace

Avatar de l’utilisateur
LePsychoSophe
Messages : 2528
Inscription : 19 sept. 2017, 17:34

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#3

Message par LePsychoSophe » 02 oct. 2020, 12:35

Merci. Je vais m'amuser 5 minutes. ;)
"ἕν οἶδα ὅτι οὐδὲν οἶδα" Σωκράτης

Avatar de l’utilisateur
Nicolas78
Messages : 11460
Inscription : 04 janv. 2013, 15:32

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#4

Message par Nicolas78 » 02 oct. 2020, 17:48

Cogite Stibon a écrit : 01 oct. 2020, 17:08 Pour éviter le hors sujet, je continue ici
Cogite Stibon a écrit : 01 oct. 2020, 09:20
A propos de votre discussion sur l'usage du "malgré que'", il y a un très bel outil de google qui permet de suivre l'évolution de l'usage d'un mot dans les livres :

https://books.google.com/ngrams/graph?c ... moothing=3
Nicolas78 a écrit : 01 oct. 2020, 15:37 Attend je comprend mal le graphique.
Est-ce que ca veux dire que, au meilleur de sa forme, "malgré-que" a été utilisé seulement dans 0,00015% des ouvrages en Français (répertoriés par Google) en 1813 ? Et qu'il a jamais fait mieux ? Ca crains sévèrement... Si c'est cela (je doute de bien comprendre le graphique).

Si oui, il reste que dans le langage populaire ca serait forcement bien plus élevé. Rien que si Google comptait ce forum, ca ferait grimper les stats en flèche :lol: La question (si j'ai bien compris le graphique), c'est : qui est dépositaire du bon gout dans la langue Française ? :a2:
Ça veut dire qu'il représentait 0,00015% des paires de mots présentes dans ces ouvrages. Plus d'info ici.
Ok merci, je comprend, en tout cas cette paire ne score pas beaucoup. J'imagine cependant qu'en dehors des ouvrages, dans les écrits "populaires" (pas les livres), et encore plus a l'orale, les résultats pourrait être bien différent.

Avatar de l’utilisateur
Etienne Beauman
Messages : 6881
Inscription : 20 févr. 2011, 18:59

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#5

Message par Etienne Beauman » 02 oct. 2020, 18:04

Cogite Stibon a écrit : 01 oct. 2020, 17:08 Ça veut dire qu'il représentait 0,00015% des paires de mots présentes dans ces ouvrages. Plus d'info ici.
Le nombre moyen de mots par romans serait de 80 000 mots.

Si on prends une phrase de huit mots.
On obtiens :
Si on
on prends
prends une
une phrase
phrase de
de huit
huit mots.

soit 7 paires.

Donc une phrase de n mots donne n-1 paires.

Le nombre de mots moyen par phrase serait de 15, soit 5333 phrase et donc 74666 paires.

Si on considère que malgré que n'est pas moins employé dans les romans que dans les autres types de livres 0.00015% de malgré que par paires ça donne 11 !
11 malgré que par romans en 1813, ça me semble énorme (je m'imaginais en avoir moins de 1 par livres), je me suis planté où ?
Au royaume des cyclopes, les borgnes sont aveugles.
Is this a discussion?

Avatar de l’utilisateur
LoutredeMer
Messages : 9014
Inscription : 30 juil. 2008, 23:34

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#6

Message par LoutredeMer » 02 oct. 2020, 21:46

:fleurs: :a2:
"Par le saumon qui se meut!.. I want my food!.. Slice me tender"..

Avatar de l’utilisateur
MaisBienSur
Messages : 6117
Inscription : 13 sept. 2012, 16:43

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#7

Message par MaisBienSur » 06 oct. 2020, 16:49

Etienne Beauman a écrit : 02 oct. 2020, 18:04 11 malgré que par romans en 1813, ça me semble énorme (je m'imaginais en avoir moins de 1 par livres), je me suis planté où ?
Achète ces romans et vérifie, ça va être l'hiver, c'est une bonne façon de passer le temps au coin du feu :lol:
Et la marmotte, elle met le chocolat dans le papier d'alu.

Avant, j'étais indécis, maintenant je n'en suis plus très sûr...

Les marmottes qui pissent au lit passent un sale hiver (Philippe Vuillemin)

Avatar de l’utilisateur
PhD Smith
Messages : 5024
Inscription : 04 août 2011, 23:23

Re: Google Books NGram Viewer, un outil pour connaitre l'usage d'une expression

#8

Message par PhD Smith » 07 oct. 2020, 23:52

Etienne Beauman a écrit : 02 oct. 2020, 18:04Le nombre moyen de mots par romans serait de 80 000 mots.
Si je reprends le site indiqué par Etienne.
A propos d'écriture a écrit :2 / Science-Fiction et de fantasy

Les romans de science-fiction et de fantasy ont généralement un nombre de mots compris entre 90 000 à 125 000. Ils comptent en effet généralement plus de mots qu’un roman de fiction.
Pourquoi ?
Voici trois 3 théories (non confirmées, car ce sont des déductions personnelles) :
Les lecteurs de science-fiction ou de fantasy sont peut-être plus enclins à lire une histoire longue.
Il se peut que ce nombre de mots plus élevés tiennent aux divers mondes à construire pour écrire un bon roman de fantasy.
Ses romans font souvent partie d’une série. Les lecteurs s’attendent davantage à des histoires sur plusieurs livres et donc à davantage de contenu.
Appliquons ces remarques à Asimov: https://www.franceculture.fr/emissions/ ... embre-2020

Asimov ne décrit pas des mondes, comme Tolkien. Il fait des nouvelles (Fondation, les robots) mais écrit des romans plus tard. La particularité d'Asimov est de faire s'entretenir les gens pour faire jaillir la solution au problème. Le détective E Bailey se déplace, rencontre les gens et Jéosaphat ! il trouve la solution.
Imagepraedicator veridicus, inquisitor intrepidus, doctor egregiusImage

Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit