Alors tu ne devrais pas utiliser ce terme. Bien évidemment, à un certain niveau les paramètres de ChatGPT sont stockées dans de la mémoire informatique classique, mais le terme BDD est très mal choisi. Sa mémoire est de même nature que la notre, elle réside dans les connexions entre ses neurones. Il ne te viendrait pas à l'idée de demander à un humain combien de mots il a dans sa BDD ?Dash a écrit : 13 janv. 2023, 03:07 Le problème, c’est que toi et Invité m’avez pris au premier degré en interprétant « BDD » au sens strict alors que je l’utilise au sens « générique~commun » comme synonyme de « mémoire » parce que d’une façon ou d’une autre il doit utiliser une fonction équivalente à la « notion de mémoire » (numérique~informatique).
Désolé mais j'insiste pour dire que ces termes sont mal choisis. Ils font partir du corpus de l'algorithmique procédurale, et les IA basées sur des réseaux de neurones ne sont pas résumables à des algorithmes procéduraux. Bien évidemment à un bas niveau il y a de l'informatique procédurale, mais ce qui importe c'est le niveau d'abstraction supérieur : le réseau et ses paramètres de pondération.J’imagine que tu effectues le même raisonnement que moi, à savoir qu’il doit nécessairement avoir accès à des « données », car quand bien même il procède par proba et « score statistique », ces derniers « scores » sont ce qui constitue « ses données ». De plus, il doit nécessairement avoir « en mémoire » tous les (enfin, d’innombrables) mots qui existent. Par exemple, le nom « « Michael Jackson », il ne peut pas le « générer » à partir du néant!Cet assemblage de lettre est soit « inscrite » quelque part dans une mémoire dont il a accès ou bien c’est un « "algo" » (façon de parler) qui permet de reconstituer ce nom (cette combinaison de lettres) précis lorsqu’en rapport avec d’autres combinaisons de lettres formant, P. Ex., « Thriller », « Billie Jean », « qui chante...? » etc., mais, dans tous les cas, il ne procède pas par « par magie ». Bref, quand moi je dis qu’il à accès à une « base de donnée », je ne parle évidemment pas d’une BDD de type SQL, je cause du concept, de la notion de « données en mémoire ».
Je ne dis pas que ce que tu dis est faux, je dis que tu ne dois pas utiliser ces termes car ils ne correspondent pas au fonctionnement de ChatGPT. Il n'y a rien qui interroge quoi que ce soit. Il y a le prompt en entrée et un mot en sortie, c'est tout. Enfin non évidemment ce n'est pas tout, mais cette simplification fonctionne bien.Mais pouvons-nous nous entendre, convenir qu’il a accès à des données numériques contenues en mémoire?
Si je lui demande quel est le nom et prénom de tel ou tel président de tel ou tel pays ou comment l’on nomme la couleur « verte » en anglais, en faisant abstraction de comment il procède dans le détail (score statistique obtenu pendant son learning, etc.), il « interroge » bien « quelque chose » puisque la magie n’existe pas!
Si tu veux, mais pas inscrit au sens ou cette information pourraient être retrouvée en parcourant les paramètres de l'IA. Le mot n'est inscrit nulle part, il est la résultante du processus.Mais le nom comme tel, il ne peut pas l’inventer de toute pièce puisqu’il est déterminé, justement, par des probabilités statistiques. Et ce nom (comme tous les autres mots), il est « inscrit » quelque part, d'une façon ou d'une autre, dans une mémoire dont il a accès!
Il serait par exemple impossible de parcourir ses paramètres pour corriger toutes les fautes d'orthographe.
Je maintiens que ce n'est pas possible et qu'il ne te donnera qu'une réponse cohérente et pas une réponse exacte. Déjà, il répond "environ 150" et pas un nombre précis, c'est un signe.Maintenant que tout ceci est clarifié, concernant ce que je disais, à savoir qu’il n’est pas en mesure de nous « dévoiler » le nombre de tel ou tel « trucs » que contient sa « base de données » (la résultante de son deep learning, si tu préfères!). Par exemple combien d’études concernant tel ou tel sujet possède-t-il ou, encore, combien de biais cognitifs sont présents dans sa « mémoire » (la résultante de son deep learning, si tu préfères!), je maintiens que c’est un non sens (compte tenu de ce qu'il a « learné »), car en fait c’est possible (j’ai réussi!). Ça dépend de comment nous lui posons la question!
Si par exemple on lui demande "Quels sont les pays d'Europe ayant la lettre a dans leur nom ?", il répond :
"Les pays d'Europe ayant la lettre "a" dans leur nom sont : Albanie, Allemagne, Autriche, Espagne, France, Grèce, Pays-Bas, Portugal."

On voit bien dans ce genre de réponse qu'il n'est pas capable de réaliser un vrai raisonnement logique. La liste est simplement fausse (il y a des pays qui manquent et d'autres qui ne devraient pas y être).
Tout ça pour insister sur le fait qu'il ne faut pas utiliser le lexique de la programmation ou de l'informatique classique ("accès", "bdd", "mémoire", "interroger", ...) pour décrire le fonctionnement d'une IA, car elle ne fonctionne simplement pas comme un programme informatique.