J'vais partager dans ce thread mes investigations et pratiques concernant le prompting avancé/Prompt engineering.
Bon, puisque tous ne sont pas des « fuckés-pseudo-autiste-hyper-passionnés » comme moi, j'vais changer d'approche : au lieu de copier/coller des essais/synthèses exhaustives complètes (désolé du pléonasme, mais j'ai pas changé à ce niveau, j'aime m'exprimer avec le style qui est le mien et qui me caractérise. Idem avec mes phrases interminables comportant 36 virgules
Note sur le contexte général du thread et des connaissances que je partagerai ici :
La grande majorité des informations qu'on retrouve sur le Net et sur les différentes chaînes YT consacrées aux IA sont soit bcp trop simplistes et peu efficaces (de type « voici le prompt magique »
- de la recherche avancée,
- des synthèses exhaustives,
- des séances de brainstorming (utiliser l'IA comme un outil de réflexion de haut niveau),
- des restructurations et réécritures de « brouillons d'ouvrage » ou de collection éparse de textes, etc.,
- la génération de fiction (roman, RPG, fiction interactive, jeux narratifs).
Conséquemment, dans ce cadre d'utilisation où ces requêtes sont effectuées, une par une, au coup par coup, il n'y a pas d'automatisation de processus qui tourne 10 000 fois par jour et donc susceptible de générer des coûts de tokens élevés. De plus, toujours dans ce cadre, les « produits finis » que l'IA génère sont toujours des textes formatés proprement en markdown et livrés soit directement dans la fenêtre de chat, soit proposés en fichier .md, .pdf ou .docx à télécharger. Aucun JSON, CSV et data volumineuse comme souvent nécessaires en contexte pro/industriel. Aucun contexte réglementé (ou guardrails complexes obligatoires). Pas de haute criticité/high-stakes (diagnostic, décisions médicales, conseils légaux) comme nécessaire en contexte pro destiné à être utilisé par le public. Aucun besoin également de critères de succès complexes et/ou lourds comme en contexte critique. Attention, cela n'empêche aucunement un « particulier expert » de créer des prompts de diagnostic médicales/psycho, ou de conseils légaux/financiers, mais dans un cadre privé, les impératifs et contraintes ne sont pas les mêmes (cela a une incidence pratique dans la façon de prompter, même si les nuances sont fines).
Conséquemment, toutes les informations qui seront partagées dans ce thread seront filtrées et adaptées* pour ce cadre spécifique d'utilisation. C'est-à-dire pour un utilisateur avancé/expert, mais qui utilise l'IA à la maison, en privé, pour lui-même et qui n'est donc pas soumis à certaines obligations légales/ne fait pas face aux mêmes contraintes que les pros qui doivent déployer des agents IA à grand échelle, etc.
Et à l’extrême opposé, les chaînes YT qui se concentrent sur les utilisations basiques/ludiques/pratico‑pratiques pour « M. et Mme Tout‑le‑Monde » s’évertuent toutes à proposer exactement la même chose : comment faire effectuer des itinéraires de voyage à GPT ou d’autres trucs ultra basiques (recettes de petits plats, etc.)
Il y a donc un vide/fossé entre ces deux cadres/extrèmes!
Pourquoi je prends soin de spécifier tout ça ?
Ce « biais industriel » n'est pas un biais répertorié directement dans la littérature (mais ses « composants » et effets sont mentionnés ici et là. Je suis juste le premier à le nommer/formaliser), il est de mon propre cru — mais si nous n'en tenons pas compte, ça change (en pratique) complètement la donne lorsque nous demandons à une IA, par exemple, la meilleure façon de prompter pour tel ou tel objectif. Autrement dit, le cadre d'utilisation spécifié plus haut (particulier/privé, mais expert faisant principalement de la recherche avancée, des synthèses exhaustives, des séances de brainstorming, etc.) est pratiquement un « edge case » pour les IA car il ne représente pas du tout la majorité des occurrences traitées dans le corpus ayant servi à leur entraînement — les données de pré-entraînement étant massivement constituées de contenus web, académiques et professionnels où l'usage privé expert à faible volume est structurellement sous-représenté. Du coup/conséquemment, on se retrouve avec des conseils et instructions de prompt mésadaptés ou des signalements d'erreur qui n'en sont pas, dans ce cadre spécifique d'utilisation. Ce phénomène, c'est le modèle qui infère implicitement un contexte d'utilisation à partir de ce qui est statistiquement le plus probable dans son corpus — autrement dit, il « pense » selon la moyenne.
Cela m'amène directement à un autre point qu'il est important de bien saisir et qui met en jeu l'un des biais des IA, que nous verrons ultérieurement en détail. Mais pour l'instant, pour faire « simple », il faut saisir que dès qu'une demande envers une IA est le moindrement « orientée », elle aura tendance à aller dans la direction de l'orientation — un comportement qu'on appelle la sycophancy (servilité du modèle), c'est-à-dire sa tendance à aligner ses réponses sur les attentes implicites ou explicites du prompt. Autrement dit, si, par exemple, n'importe qui ici soumet à une IA quoi que ce soit que je partagerai en lui demandant de trouver des failles et des erreurs, ce qui est nécessairement « orienté », mais tout à fait légitime comme demande, et bien les probabilités que l'IA trouve des « erreurs » sont très élevées. Est-ce parce qu'elle confabule et « invente des erreurs ou inexactitudes » — c'est-à-dire génère des informations plausibles mais non vérifiées, déclenchées par la direction du prompt ? Est-ce parce que ce que je vais partager contient réellement des erreurs ou inexactitudes ?
Oui et non ! Les deux ! En fait ça dépend!
De quoi ?
Ben du contexte et du cadre d'utilisation justement! Et, aussi, selon le type d'approche! Parce qu'analyser un conseil ou un prompt selon l'approche SOTA (State-Of-The-Art, c'est-à-dire selon l'état de l'art théorique) ou selon l'approche « Top expert » — c'est-à-dire selon ce qui est optimal en pratique dans un contexte spécifique — ne produit pas les mêmes résultats. Car parfois, ce qui est valide en théorie ne l'est pas complètement ou diffère quelque peu en pratique (l'on pourra développer cet aspect ultérieurement si ça en intéresse certains). Donc avant de venir me dire « Hey, j'ai soumis ton texte/prompt à GPT et il a dit que bla-bla-bla », il vous faut procéder avec une rigueur exemplaire lors de vos prompts (vos formulations et demandes à l'IA). C'est-à-dire :
- spécifier le contexte d'utilisation,
- spécifier de souligner les différences (s'il y en a) entre « SOTA » et « pratique experte confirmée par l'expérience »,
- spécifier d'expliquer pourquoi, de justifier sa réponse.
Sinon, l'IA pourrait vous dire (un exemple parmi d'autres, juste pour saisir) que tel ou tel conseil ou instruction n'est pas approprié, alors que ce n'est pas le cas... parce qu'elle a jugé (sans le mentionner) que cela allait générer trop de tokens et donc être coûteux à l'utilisation (selon les règles SOTA). Sauf que le cadre n'incluant pas un déploiement à grande échelle, l'instruction était en fait plus efficiente (et générait plus de précision) que la suggestion de l'IA qui « pense » selon la « moyenne du corpus » où, majoritairement, les techniques de prompting cherchent à économiser des tokens.
Vous saisissez?
Par expérience, j'ai constaté qu'on peut passer un texte 40 fois dans toutes les IA existantes, versions après version, même après la 40e itération, elles trouveront toujours de quoi à redire si on leur demande de trouver des erreurs sans ne rien spécifier d'autre, en termes de contraintes, de cadres, de contextes, etc. — et ce, en partie simplement parce que le processus de génération (dès que le paramètre de température est au dessus de zero) est non-déterministe : chaque appel peut activer des chemins différents et donc produire des « problèmes » différents, indépendamment même de la sycophancy.
Donc avant de partager des astuces et des prompts complet ultra-optimisés (la partie fun et pratique), je vais d'abord partager ce qui est essentiel de connaître et savoir. Et à mon avis, ce sont les différents biais affectant les IA ainsi que quelques principes et notions de bases (mais trop peu abordées sur YT). Si les sections théoriques ou techniques vous rebutent ou vous semblent trop lourdes, passez directement aux sections « Mitigation », qui sont en fait les moyens pratiques (mais généraliste, pas encore optimisé par mes soins) de minimiser l'effet des biais et tendances par defaut des IA lorsque vous interagissez avec les IA. Donc premier sujet : les biais des IA !
Je vais poster, pour débuter, un à un, les biais que j'ai observés/rencontré/répertorié lors de mes utilisation/investigations. Toutes les infos sont « up-to-date » en date de mai 2026.
*Sauf pour les biais. Pour les biais (et peut-être pour quelques autres notions cruciales), puisqu'ils sont essentiels à connaitre (c'est vraiment la base, si l'on veut se distinguer des autres et obtenir des résultats que les autres n'obtiennent pas), je laisse les détails techniques/théoriques les concernant. Ensuite, après les biais et notions, ça va être moins « lourd » et plus « pragmatique ».