Salut AT,
Je suis pas mal d'accord avec toi. Je ne prétends pas avoir réalisé un bien gros exploit quand on évalue l'affaire strictement en terme de "vrai ou faux".
En terme de "vrai ou faux", aurais-tu donné "vrai" à quelqu'un qui aurait deviné ASHRPZ (5 lettres correctes sur 6) au-dessus d'une carte du
sud de l'Italie ?
Évaluer probabilistiquement la performance en terme de "vrai ou faux" me paraît inadéquat. On peut faire mieux.
Autre exemple : Si la cible est C=
"une image de mouton", il me semble que la description D1=
"une image de chèvre" est un meilleur "fit" que D2=
"une image" (même si, techniquement, D2 est vraie et D1 ne l'est pas).
En fait, le problème est plus totché qu'il paraît.
Il y a deux façons de probabiliser l'affaire, selon qu'on
fixe la cible (et qu'on fait varier les descriptions au hasard) ou qu'on
fixe la description (et qu'on fait varier les cibles au hasard).
Ça ne donnera pas nécessairement la même probabilité. Dans le premier cas, on se place du point de vue de l'expérimentateur. Dans le second, on se place du point de vue du "devin".
Tiens. Pour fixer les idées, imaginons qu'on a un très grand nombre (n) d'expérimentateurs qui choisissent des cibles C1, C2, ... , Cn. Imaginons aussi qu'on a un très grand nombre (m) de "devins" qui formulent des descriptions D1, D2, ... , Dm.
Certaines
cibles (ex. un croquis de soleil ou une page blanche) sont beaucoup plus "ouvertes" (i.e. "exactement devinables") que d'autres (ex. la cible que tu viens de créer). À l'opposé, certaines
descriptions très générales (ex. un bout de papier, un mot) sont plus "ouvertes" que d'autres (ex. le nombre "847563736476").
Imaginons qu'on dispose d'un dieu (ou, pour rester terre-à-terre, d'un vaste conseil de juges) qui peut ordonner,
pour chaque cible Ci, les m descriptions D1, D2, ... , Dm en rang de
qualité de "fit". S'il y a des
ex aequo, on leur donne le rang moyen.
Inversement, et de la même façon,
pour chaque description Dj, le comité de juges pourrait ordonner toutes les cibles C1, C2, ... , Cn en ordre de qualité de "fit".
Pour fixer les idées, supposons que
ta cible est C1 et que
ma description est D1.
De
ton point de vue (avec cible fixe), ma performance de devin s'évalue probabilistiquement via la proportion des descriptions (parmi D1 à Dm) qui sont meilleures que mon D1.
De
mon point de vue (avec description fixe), ma performance de devin s'évalue probabilistiquement via la proportion des cibles (parmi C1 à Cn) qui sont meilleures que ton C1.
Ces deux évaluations probabilistes peuvent différer fortement l'une de l'autre. On peut aisément construire des exemples (artificiels, j'en conviens) où, pour C1 fixe, D1 soit le
meilleur de tous les Dj et, pour D1 fixe, C1 soit le
pire de tous les Ci. Dans un tel cas, c'est super-bon ou c'est super-mauvais ?
Les deux façons d'évaluer la probabilité "que le hasard fasse mieux", deviennent équivalentes si on suppose que la distribution des cibles est la même que la distribution des descriptions. Mais alors on a un gros problème conceptuel : comment peut-on, concrètement, faire qu'une cible soit une image sans être une image
de quelque chose ? Les descriptions (qui sont en mots) sont nécessairement plus floues que les cibles (qui sont concrètes).
Je n'ai pas de solution pratique permettant d'
objectiviser ces deux probabilités subjectives. La seule que je vois est que l'ensemble {C1, C2, ... . Cn} des cibles permises soit défini à l'avance (et connu du devin). Et que les descriptions permises soient le même ensemble.

Denis