L'Argument de l'Apocalypse

Tout sur les sciences, que ce soit la chimie, la biologie, l'astronomie etc.
Répondre
Avatar de l’utilisateur
drzinn
Messages : 66
Inscription : 18 janv. 2016, 16:54

L'Argument de l'Apocalypse

#1

Message par drzinn » 20 déc. 2016, 19:20

The Doomsday Argument dans la langue de 50Cents, est une prédiction de la durée de vie de l'humanité, basée exclusivement sur les probas et donc n'a rien à voir avec Donald Trump ou le RCA.

En résumé, si on tire au hasard un numéro n parmi une collection strictement croissante, on peut prédire avec 95% de chance la taille maximum de cette collection : 20n. Si on applique cette formule à un numéro au hasard de l'humanité (moi, ou vous, nous ne sommes personne de particulier après tout), ce numéro est à peu près 100 milliards et donc la taille max de l'humanité est à 95% 2000 milliards, ce qui si on utilise un modèle prévisionnel moyen de la démographie mondiale nous amène en 12016, voire beaucoup plus tôt si on est très pessimiste sur la croissance démographique. Ce raisonnement est bien mieux vulgarisé sur ce site que par moi.

Ayant été biberonné à la science-fiction depuis des décennies, la rencontre avec cet argument m'a sérieusement choqué, moi qui était habitué à imaginer un futur glorieux (ou infamant selon les auteurs) de conquête de l'espace et de mutations à l'infini pour créer des phénotypes adaptés aux environnements. Puis je me suis mis à réfléchir, tout en gardant en tête que les probas n'ont jamais été mon fort (j'ai mis longtemps à intégrer le fait que la probabilité d'avoir un garçon était différente sachant que le premier enfant était une fille ou que l'un des deux enfants était une fille, et je bloque toujours sur le pourquoi je devrai changer de rideau après qu'on m'ait dit qu'il n'y avait rien derrière le rideau C). Je vais donc éviter de me mettre dans la peau du gars qui n'y connait rien en physique et qui essaie de construire une machine à énergie libre dans son garage parce que "le magnétisme quoi !".

J'ai donc quelques questions/remarques que j'espère pertinentes :
1) Prendre un contemporain, par définition le dernier d'une liste, et le considérer comme tiré au hasard est-il justifié ? Si je compte le nombre de mots dans un extrait littéraire du magazine Lire, puis-je faire une prévision fiable de la longueur totale de l’œuvre ?
2) Toute cette histoire manque de définition, comment le raisonnement pourrait-il être le même pour deux ensembles différents, l'un incluant l'autre. Je veux dire si on définit humanité par "ensemble des homo sapiens" ou par "ensemble des homo sapiens et de tous leurs descendants" le nombre est potentiellement très différent et pourtant cet argument nous donne le même résultat
3) Le raisonnement est semblable pour le nombre d'individus et la durée de vie et donne deux chiffres très différents. Si on raisonne sur l'âge de l'humanité, estimée de 100 000 ans alors son espérance de vie est à 95% de chance de moins de 2 millions d'années, mais si on raisonne sur le nombre d'individus, à moins de scénario démographique très alambiqué on est à 95% de chance à moins de 10 000 ans. Il y a là une réelle contradiction qui m'échappe.

Si vous avez des réponses à mes questions (ou des besoins de clarification) merci beaucoup, si vous avez d'autres questions à soulever soyez les bienvenus.
Dernière modification par drzinn le 20 déc. 2016, 20:28, modifié 1 fois.

Avatar de l’utilisateur
Vathar
Messages : 1014
Inscription : 23 sept. 2016, 15:41

Re: L'Argument de l'Apocalypse

#2

Message par Vathar » 20 déc. 2016, 20:20

Même si l'article est intéressant, je trouve que le facteur temps se transpose très mal entre la durée (finie) d'une chanson, le nombre (fini) de chars Allemands présents sur le champ de bataille et la population humaine en constante croissance.

Transposons l'analogie aux chars et aux canons. Observer les numéros de série permet de faire une prédiction probabiliste sur le nombre de chars actuellement en circulation, mais ne fournit pas d'information sur le nombre de chars Allemands qui seront produits dans un futur indéterminé.

Vu que le facteur temps est traité cavalièrement, prenons une DeLorean et retournons en 8000 avant JC. On nous dit ici qu'environ 1.2M d'humains avaient vécu à cette date.

On aurait donc une fourchette d'humains totaux entre 2.4 et 24 millions d'individus. Certes ce n'est qu'une estimation à 95% mais çà jette un peu un pavé dans le raisonnement.

Ou alors on ignore le fait que la croissance humaine a été exponentielle ...
Ou alors, comme vous le dites, c'est parce que prendre le dernier élément connu d'une série ne peut pas etre considéré comme un tirage aléatoire et fout tout en l'air (s'il y a des statisticiens dans la salle, je suis moi aussi curieux d'avoir leur point de vue)

Bref, je n'accorderais pas trop de crédit à cet argument que je considère bien trop réducteur.

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#3

Message par Psyricien » 20 déc. 2016, 20:25

drzinn a écrit :The Doomsday Argument dans la langue de 50Cents, est une prédiction de la durée de vie de l'humanité, basée exclusivement sur les probas et donc n'a rien à voir avec Donald Trump ou le RCA.

En résumé, si on tire au hasard un numéro n parmi une collection strictement croissante, on peut prédire avec 95% de chance la taille maximum de cette collection : 20n. Si on applique cette formule à un numéro au hasard de l'humanité (moi, ou vous, nous ne sommes personne de particulier après tout), ce numéro est à peu près 100 milliards et donc la taille max de l'humanité est à 95% 2000 milliards, ce qui si on utilise un modèle prévisionnel moyen de la démographie mondiale nous amène en 12016, voire beaucoup plus tôt si on est très pessimiste sur la croissance démographique. Ce raisonnement est bien mieux vulgarisé sur ce site que par moi.
Commençons par ton lien:
--> Le délire sur la proba d'être dans les 15 première secondes.
En vrac:
*Pourquoi 5 min ?
*Pourquoi 15 secondes ?
*En quoi est-ce assimilable au "50 000 ans" de l'espèce humaine ? (qui est plus vieille que cela soit dit en passant).
Bref c'est une collection de chiffres aléatoire. Ca n'a aucune valeurs. On pourrait prendre des chiffres complètement différents, puisqu'il ne sont pas justifiés et aboutir à des résultats complètement différents ;).

--> Le second est un petit délire amusant, qui regarde des estimateur statistique.
*Observer le numéro X d'une série de N éléments, permet en effet de dire que sachant K on trouve au moins X avec une proba de P(X|K) = X/K.
Cependant, on peux pas naïvement inverser cette relation et dire que K à une probabilité X/K. L'objet estimé de la sorte n'est pas une probabilité (pour K) !!! En fait P(K|X) n'est pas vraiment estimable, la distribution ne converge pas pour une distribution uniforme (car la somme des X/K pour K > X diverge).
Donc ici le raisonnement proposé est fallacieux, car il inverse une proba alors qu'il n'a pas le "droit" de le faire. Une simple approche du dénombrement met à bas les propos du gus.
*Encore une fois le 95% est complètement arbitraire ... si il avait pris 90% s'eut été la même chose. Il aurait tout aussi bien pu prendre 10% :lol:

--> Le point 3 est une propagation des nombre arbitraire du point 1, et des erreurs de raisonnement du point 2.
Bref c'est complètement n'importe quoi :(.

Ayant été biberonné à la science-fiction depuis des décennies, la rencontre avec cet argument m'a sérieusement choqué, moi qui était habitué à imaginer un futur glorieux (ou infamant selon les auteurs) de conquête de l'espace et de mutations à l'infini pour créer des phénotypes adaptés aux environnements. Puis je me suis mis à réfléchir, tout en gardant en tête que les probas n'ont jamais été mon fort (j'ai mis longtemps à intégrer le fait que la probabilité d'avoir un garçon était différente sachant que le premier enfant était une fille ou que l'un des deux enfants était une fille
Sauf processus biologique magique dont j'ignore la teneur, en terme de stats pure, la proba du sexe pour le deuxième enfant ne dépend pas du sexe du premier enfants. Car apriori la conception des deux enfants sont des évènements indépendants ;).
Ainsi les combinaison:
A) fille-garçon
B) fille-fille
C) garçon-fille
D) garçon-garçon
sont équiprobable. Et comme on le vois, si le premier enfant est une fille (cas A et B) cela implique que les chances que le second enfant soit une fille ou un garçon est équiprobable.
De même avec 2 enfants on 50/50 au niveau chance d'avoir deux enfants du même sexe ou deux enfant de sexe diférent.
Les choses changent avec un nombre croissant d'enfant, mais le sexe du Nième enfant est indépendant du sexe des N-1 enfants précédent et à 50/50 d'être fille ou garçon.
Pour 3 enfants: chances d'avoir 3 filles : 1/8, 3 garçon : 1/8. Chances d'avoir 3 mouflets du même sexe 1/4.
, et je bloque toujours sur le pourquoi je devrai changer de rideau après qu'on m'ait dit qu'il n'y avait rien derrière le rideau C).


Très simple:
1) Quand tu fait un choix parmis 3 propositions (dont une seule est bonne) tu as 1/3 d'avoir bon.
2) Quand l'un des deux choix restant est révélé comme faux. Cela implique que le rideau non-dévoilé à 1 chance sur 2 d'être le bon.
3) Hors tu as choisi au début avec une 1/3 d'avoir bon, changer ton choix monté tes chances à 1/2.
Cela reste des proba, et changer de "rideau" peut quand même te faire perdre au final, mais tes chances seront meilleures :).
Je vais donc éviter de me mettre dans la peau du gars qui n'y connait rien en physique et qui essaie de construire une machine à énergie libre dans son garage parce que "le magnétisme quoi !".
Sage décision :).
J'ai donc quelques questions/remarques que j'espère pertinentes :
1) Prendre un contemporain, par définition le dernier d'une liste, et le considérer comme tiré au hasard est-il justifié ? Si je compte le nombre de mots dans un extrait littéraire du magazine Lire, puis-je faire une prévision fiable de la longueur totale de l’œuvre ?
Non ça ne l'est pas, tu as spotté l'un point idiot du raisonnement en question :).
2) Toute cette histoire manque de définition, comment le raisonnement pourrait-il être le même pour deux ensembles différents, l'un incluant l'autre. Je veux dire si on définit humanité par "ensemble des homo sapiens" ou par "ensemble des homo sapiens et de tous leurs descendants" le nombre est potentiellement très différent et pourtant cet argument nous donne le même résultat
Pire, imagine maintenant que tu considère les hominidés et non les homo-sapiens. Avec la logique proposé dans le dit lien, le résultats sera fort différent ... ce qui montre le coté arbitraire des chiffres choisis.

3) Le raisonnement est semblable pour le nombre d'individus et la durée de vie et donne deux chiffres très différents. Si on raisonne sur l'âge de l'humanité, estimée de 100 000 ans alors son espérance de vie est à 95% de chance de moins de 20 millions d'années, mais si on raisonne sur le nombre d'individus, à moins de scénario démographique très alambiqué on est à 95% de chance à moins de 10 000 ans. Il y a là une réelle contradiction qui m'échappe.
Il y a contradiction car le raisonnement proposé n'est pas logique et: (1) utilise des chiffres arbitraires, (2) commet de grave erreurs de statistiques.
Tu peux jeter ce raisonnement à la poubelle, il n'a aucune valeur. D'où de grave contradiction :(.
Si vous avez des réponses à mes questions (ou des besoins de clarification) merci beaucoup, si vous avez d'autres questions à soulever soyez les bienvenus.
En espérant que ma réponse t'ai été utile,
G>


PS: à la fin de l'article l'auteur tente de causer de stat et d'avoir l'air intelligent.
Plusieurs soucis:
1) Il parle de la différence fréquentiste/bayésien ... pour faire malin of course.
Par exemple il donne l'estimateur dans le cas fréquentiste ... mais il ne donne pas l'erreur sur cette estimateur .... :lol:
De même, quand il présente l'estimateur bayésien, il oublie de dire qu'àpriori ce qu'il note K, n'est pas connue et peux être aussi grand que désiré ... ainsi le terme "log(K-1)" diverge ;).
2) Il fait en fait l'hypothèse naïve P(X|K) = P(K|X) ... ce qui est inepte :(.
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Avatar de l’utilisateur
drzinn
Messages : 66
Inscription : 18 janv. 2016, 16:54

Re: L'Argument de l'Apocalypse

#4

Message par drzinn » 20 déc. 2016, 21:28

Merci Psyricien, mais j'ai besoin de précision :
Psyricien a écrit : Commençons par ton lien:
--> Le délire sur la proba d'être dans les 15 première secondes.
En vrac:
*Pourquoi 5 min ?
*Pourquoi 15 secondes ?
*En quoi est-ce assimilable au "50 000 ans" de l'espèce humaine ? (qui est plus vieille que cela soit dit en passant).
Bref c'est une collection de chiffres aléatoire. Ca n'a aucune valeurs. On pourrait prendre des chiffres complètement différents, puisqu'il ne sont pas justifiés et aboutir à des résultats complètement différents ;).
Un événement a une durée T, divisible en A moments égaux T= T/A + T x(A-1)/A. Un moment t a bien une probabilité de ((A-1)/A) de se trouver après t0+T/A. Ici la chanson est juste un exemple, avec T=300s et A=20, on se retrouve avec 95% de chance d'être après les 15 premières secondes ? Si on prend A=2, on a bien 1/2 chance d'être avant le milieu et 1/2 d'être après. Je ne vois pas ici d'erreur de raisonnement.
Supposer que la durée de vie de l'humanité est limitée reste dans le champ du probable (et c'est une litote), et si on suppose son âge actuel de 50000 ans (peu importe que ce soit le vrai chiffre), on a aussi 95% de chance d'être après les 5 premiers pourcent de la durée de l'humanité, les 50000 ans sont assimilés aux 15 secondes. En quoi est-ce faux ?


Psyricien a écrit : --> Le second est un petit délire amusant, qui regarde des estimateur statistique.
*Observer le numéro X d'une série de N éléments, permet en effet de dire que sachant K on trouve au moins X avec une proba de P(X|K) = X/K.
Cependant, on peux pas naïvement inverser cette relation et dire que K à une probabilité X/K. L'objet estimé de la sorte n'est pas une probabilité (pour K) !!! En fait P(K|X) n'est pas vraiment estimable, la distribution ne converge pas pour une distribution uniforme (car la somme des X/K pour K > X diverge).
Donc ici le raisonnement proposé est fallacieux, car il inverse une proba alors qu'il n'a pas le "droit" de le faire. Une simple approche du dénombrement met à bas les propos du gus.
*Encore une fois le 95% est complètement arbitraire ... si il avait pris 90% s'eut été la même chose. Il aurait tout aussi bien pu prendre 10% :lol:

--> Le point 3 est une propagation des nombre arbitraire du point 1, et des erreurs de raisonnement du point 2.
Bref c'est complètement n'importe quoi :(.
Je ne comprends pas, pourquoi dis-tu qu'on a "naïvement inversé la relation et dit que K a une probabilité de X/K", ce n'est pas ce qui est fait il me semble ? et aussi "P(K|X) n'est pas vraiment estimable", rejoint le point au-dessus, je ne vois pas pourquoi.

Psyricien a écrit : Sauf processus biologique magique dont j'ignore la teneur, en terme de stats pure, la proba du sexe pour le deuxième enfant ne dépend pas du sexe du premier enfants. Car apriori la conception des deux enfants sont des évènements indépendants ;).
.....

Très simple:
1) Quand tu fait un choix parmis 3 propositions (dont une seule est bonne) tu as 1/3 d'avoir bon.
2) Quand l'un des deux choix restant est révélé comme faux. Cela implique que le rideau non-dévoilé à 1 chance sur 2 d'être le bon.
3) Hors tu as choisi au début avec une 1/3 d'avoir bon, changer ton choix monté tes chances à 1/2.
Cela reste des proba, et changer de "rideau" peut quand même te faire perdre au final, mais tes chances seront meilleures :).
Je te remercie mais je n'avais pas besoin de ces explications, je les connaissais, je voulais juste dire qu'il y avait une différence entre connaître un raisonnement et l'assimiler, mon "bon sens" me hurle toujours "MAIS POURQUOI ?" quand je lis la conclusion des rideaux à tirer.


Enfin, le blogueur du lien n'est pas l'inventeur de cet argument, juste un vulgarisateur, et je suis bien au courant que le nombre n'est pas une preuve de vérité, mais si la réfutation est juste que l'auteur s'est planté de bout en bout et ne connait rien aux probas il me semble que la page Wikipédia se serait faite démonter par les mathématiciens depuis le temps ?

Avatar de l’utilisateur
BeetleJuice
Messages : 6568
Inscription : 22 oct. 2008, 22:38

Re: L'Argument de l'Apocalypse

#5

Message par BeetleJuice » 20 déc. 2016, 21:44

psyricien a écrit :Pire, imagine maintenant que tu considère les hominidés et non les homo-sapiens. Avec la logique proposé dans le dit lien, le résultats sera fort différent ... ce qui montre le coté arbitraire des chiffres choisis.
Sans parler du fait que la vie n'est de toute façon pas un élément discontinu en vrai et qu'on ne saurait définir le premier membre d'une espèce sans toucher au limite de la définition et à la part d'arbitraire de cette dernière. Si en mathématique, on peut s’accommoder de l'arbitraire d'un système d'axiome pour résoudre des problèmes logiques qui sont à la base abstrait et idéaux, on peut difficilement prétendre appliquer la même logique à des éléments concrets.
Si on admet par exemple que les mécanismes de spéciation sont tel que le décrit le néo-darwinisme, on sait que l'évolution est globalement lente et très progressive et donc ça devient tendu de faire des séries avec les membres d'espèces dont on n'est pas vraiment capable de déterminer avec quels individus elles commencent. Soit on définit ça arbitrairement et il faut justifier que ça n'est pas qu'un raisonnement abstrait, soit on ne définit pas ça arbitrairement et on peut remonter l'entièreté de l'arbre de la vie (voir même l'ensemble de l'histoire de la matière s'il s'avérait impossible d'établir une rupture entre l'organique et l'inorganique) sans jamais trouver un début de série qui n'en relève pas en partie.

C'est bien parce que la perfection mathématique ne s'applique jamais exactement à la réalité que la science teste ses modèles et ne prend pas pour acquis un raisonnement mathématique, même juste et qui prétend modéliser le réel.
Sinon, ça fait belle lurette qu'on aurait admise pour vrai la théorie des cordes et on ne serait pas en train de chercher, pour l'instant en vain, les partenaires super-symétrique des particules élémentaires.
This is our faith and this is what distinguishes us from those who do not share our faith.

(John Flemming, Évêque irlandais, 3ème dan de tautologie, ceinture noire de truisme, champion des lapalissades anti-avortement.)

Avatar de l’utilisateur
Etienne Beauman
Messages : 6881
Inscription : 20 févr. 2011, 18:59

Re: L'Argument de l'Apocalypse

#6

Message par Etienne Beauman » 20 déc. 2016, 22:12

drzinn a écrit :Supposer que la durée de vie de l'humanité est limitée reste dans le champ du probable (et c'est une litote), et si on suppose son âge actuel de 50000 ans (peu importe que ce soit le vrai chiffre), on a aussi 95% de chance d'être après les 5 premiers pourcent de la durée de l'humanité, les 50000 ans sont assimilés aux 15 secondes. En quoi est-ce faux ?
Les 50000 ans ne sont tout simplement pas le résultat d'un tirage aléatoire d'un âge parmi tous les âges de l’événement "espèce humaine".
Avec le même calcul je déduis que j'ai 95% de chance de vivre 802 ans max. :a2:
Au royaume des cyclopes, les borgnes sont aveugles.
Is this a discussion?

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#7

Message par Psyricien » 20 déc. 2016, 23:14

drzinn a écrit :Merci Psyricien, mais j'ai besoin de précision :
Ok let's go :).
Un événement a une durée T, divisible en A moments égaux T= T/A + T x(A-1)/A. Un moment t a bien une probabilité de ((A-1)/A) de se trouver après t0+T/A. Ici la chanson est juste un exemple, avec T=300s et A=20, on se retrouve avec 95% de chance d'être après les 15 premières secondes ? Si on prend A=2, on a bien 1/2 chance d'être avant le milieu et 1/2 d'être après. Je ne vois pas ici d'erreur de raisonnement.
L'erreur est que les chiffres choisi sont arbitraire. Pourquoi serait-on dans les premier 5% des humains ?
Il sort d'ou ce chiffre ?
Tant que ce chiffre n'est pas justifier, tout le reste relève de la Br***ette ;).
Sans parler des erreurs en stats qui viennent ensuite :(.
Supposer que la durée de vie de l'humanité est limitée reste dans le champ du probable (et c'est une litote), et si on suppose son âge actuel de 50000 ans (peu importe que ce soit le vrai chiffre), on a aussi 95% de chance d'être après les 5 premiers pourcent de la durée de l'humanité, les 50000 ans sont assimilés aux 15 secondes. En quoi est-ce faux ?
Les chiffres sont choisis au pif ... tu pourrais en prendre d'autre ... et tu auras un résultat différent.
Au final, la seule chose que tu calcul c'est ta capacité à trouver la réponse que tu veux avec ce genre de calcul ;).
50 000 par 200 000 ... et garde le 95% ... et pouf ton "estimation" change d'un facteur 4.
Par ce que en fait tu n'a aucun moyen de savoir si les 50 000 correspondent à 1% ou à 99% ... c'est un choix arbitraire entre 0 et 100%.
Qui au final nullifie complètement le calcul proposé.

Je ne comprends pas, pourquoi dis-tu qu'on a "naïvement inversé la relation et dit que K a une probabilité de X/K", ce n'est pas ce qui est fait il me semble ? et aussi "P(K|X) n'est pas vraiment estimable", rejoint le point au-dessus, je ne vois pas pourquoi.
Si si, c'est ce que le gus fait:
--> Il part de l'idée que si tu as une chance X/K trouver au moins X sachant K (P(X|K)).
--> Il retourne la proba et considère donc que si X/K = 0.05 il crois que cela signifie que à 95% il estime la proba de K sachant X.
En particulier cette phrase est inepte:
le blog a écrit :En développant un peu plus le calcul probabiliste, on peut même affirmer qu’à 95% de chances, N est inférieur à 20 fois le nombre M. Donc si vous avez observé le canon n°78, la meilleure estimation est 156, et à 95% de chances il y a moins de 1560 canons.
Il passe de sachant M, j'ai 5% de chance de tomber sur un chiffre N plus petit que M/20 ... à sachant M (78), il y aurait 95% de chances d'avoir moins de 20*M canons.
Ce n'est pas logique.
Si tu n'a aucun "prior" sur "M" alors tu doit partir que tout le "M" sont équiprobable.
Maintenant sachant M la proba d'observer un nombre plus petit que N est P(N|M) = N/M.
Donc tu as 5% de chances de tomber sur un chiffre plus petit ou égale à M/20.
Mais maintenant si tu laisses M varier (puisque c'est ça que tu veux), tu te retrouve avec une estimation de P(N|M) pour chaque M, sauf que toi tu connais N et pas M. Et la probabilité P(M|N) doit être normalisé à 1 quand tu intègre la distribution pour tout le M possible.
Hors, cette distribution diverge ... bref avec une seule valeur, tu ne peux pas estimer M à partir de N si tu n'a aucun apriori sur M.
Tu pourra construire l'estimateur M = 2*N ... mais si tu estime la barre d'erreur sur un tel estimateur ... tu va te rendre compte qu'elle est infinie (si tu le fait proprement of course).
Enfin, le blogueur du lien n'est pas l'inventeur de cet argument, juste un vulgarisateur, et je suis bien au courant que le nombre n'est pas une preuve de vérité, mais si la réfutation est juste que l'auteur s'est planté de bout en bout et ne connait rien aux probas il me semble que la page Wikipédia se serait faite démonter par les mathématiciens depuis le temps ?
Met moi le lien de la dite page en question, et je te dirais si le contenu est correct ;).
En l’occurrence je critique un blog, pas une page wiki (que je n'ai pas lu). Il y a fort à parier que la page wiki ne présente pas les choses comme ce gus.
Qui a l'évidence à un niveau en stat assez discutable ;).
En occurrence, ce qu'il faut c'est justifier l'hypothèse que nous sommes dans les premier 5% ... et ça sans connaitre notre date d'extinction ... c'est impossible à estimer proprement ;).

Note que je serait ravi de commenter l'article wiki si tu post le lien.
G>


A plus,
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#8

Message par Psyricien » 21 déc. 2016, 00:13

Je viens de faire un tour sur wiki ... (PS: et je viens de voir que tu avais filler le lien en début d'article ... faut vraiment que je dorme :lol: )
https://fr.wikipedia.org/wiki/Argument_de_l'apocalypse

Misère ... j'ai presque de la peine pour ceux qui voyaient un paradox la dedans.
Heureusement la bonne réponse est donnée :).

Le truc reste d'une naïveté consternante ...
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Avatar de l’utilisateur
drzinn
Messages : 66
Inscription : 18 janv. 2016, 16:54

Re: L'Argument de l'Apocalypse

#9

Message par drzinn » 21 déc. 2016, 00:17

Merci Psyricien de te pencher sur mes questionnements, mais j'ai parfois l'impression de trouver les probas bien plus bizarres que la mécanique quantique.

La page Wiki c'est le premier mot de mon post initial : https://fr.wikipedia.org/wiki/Argument_de_l'apocalypse.
Bon ça manque un peu de publications scientifiques et donc de revue par des pairs mais je ne pensais pas que sur des thèmes de maths il y ait des trucs aussi faux qui persistent.
L'erreur est que les chiffres choisi sont arbitraire. Pourquoi serait-on dans les premier 5% des humains ?
Et moi je comprends que le raisonnement est de considérer qu'il y a 95% de chances de NE PAS faire partie des 5 premiers %, ça serait la même chose de dire qu'il y a 70% de chance de ne pas faire partie des premiers 30 %, ou 1/2 d'être avant ou après le milieu. Et là je ne comprends pas en quoi c'est une erreur.
Sinon la suite tu as raison, il inverse la proba P(N|M) pour dire P(M|N) et d'après toi c'est une erreur de logique, d'accord.
La seule chose qu'on peut affirmer après avoir tirer N, c'est que M>N, peut-on faire d'autres prédictions ? Si on fait plusieurs tirages cela deviendrait possible d'avoir une marge d'erreur raisonnable ?
Sans parler du fait que la vie n'est de toute façon pas un élément discontinu en vrai et qu'on ne saurait définir le premier membre d'une espèce sans toucher au limite de la définition et à la part d'arbitraire de cette dernière. Si en mathématique, on peut s’accommoder de l'arbitraire d'un système d'axiome pour résoudre des problèmes logiques qui sont à la base abstrait et idéaux, on peut difficilement prétendre appliquer la même logique à des éléments concrets.
Beetlejuice : Je suis d'accord avec toi mais je pense que c'est passer à côté du problème, on pourrait très bien choisir de manière arbitraire un individu 0 et à l'aide d'une machine à remonter le temps comptabiliser tous ses descendants jusqu'à aujourd'hui (c'est une expérience de pensée hein), ça ne changerait rien. D'après Psyricien le raisonnement est erroné de manière bien plus fondamentale et il ne sert à rien de lui chercher des défauts accessoires.

Avatar de l’utilisateur
Vathar
Messages : 1014
Inscription : 23 sept. 2016, 15:41

Re: L'Argument de l'Apocalypse

#10

Message par Vathar » 21 déc. 2016, 02:10

drzinn a écrit :Et moi je comprends que le raisonnement est de considérer qu'il y a 95% de chances de NE PAS faire partie des 5 premiers %, ça serait la même chose de dire qu'il y a 70% de chance de ne pas faire partie des premiers 30 %, ou 1/2 d'être avant ou après le milieu. Et là je ne comprends pas en quoi c'est une erreur.
Deux choses :

1. On connaît la durée totale de la chanson, pas celle de l’espèce humaine.

Le postulat "15 secondes de la chanson" = "5% de sa durée totale" implique de connaître cette durée totale.

Pour une chanson de 300 secondes :

"Quelle est la probabilité que vous arriviez pendant les 15 premières secondes de la chanson ?" Revient à dire "Quelle est la probabilité que vous arriviez pendant les premiers 5% de la chanson ?"

La réponse est donc facile, la probabilité est de 5%.

Plutôt que de transposer directement d'une chanson de durée connue a l’espèce humaine, passons par l’étape "chanson de durée inconnue". C'est tout de suite plus clair.

On ne sait pas combien de temps dure cette chanson. Quelle est la probabilité que vous arriviez pendant les 15 premières secondes de la chanson ?

Pour autant que l'on sache, 15 secondes pourraient représenter 1, 5, 10 ou 100% de la durée de cette chanson. La réponse 5% n'a plus de raison d’être.

Remplacez maintenant la chanson de durée inconnue par l’espèce humaine, les 15 secondes par 50000 ans et vous devriez voir que ça coince

2. Un quart d'heure avant la mort il vivait encore

il y a 95% de chances qu’on ait déjà dépassé le premier vingtième de son existence. est une monstrueuse Lapalissade : Il y a 95% de chances qu'on ne soit pas dans les 5% restants. "Qu'on ne soit pas dans les 5% restants" voulant bien dire "qu'on soit dans les autres 95%", il y a donc 95% de chances qu'on se situe dans les 95% de l’échantillon? Ben ça c'est révolutionnaire!

Avatar de l’utilisateur
Etienne Beauman
Messages : 6881
Inscription : 20 févr. 2011, 18:59

Re: L'Argument de l'Apocalypse

#11

Message par Etienne Beauman » 21 déc. 2016, 10:33

Vathar a écrit :C'est tout de suite plus clair.
Oui. Sans ce soucier de l'énoncé c'est évident que ça ne colle pas.
Il m'a fallu un peu plus de temps pour comprendre où se cachait le paradoxe que je ne voyais pas. Ça me semblait juste complétement con.
En lisant le wiki français ça reste artificiel
"En prenant un individu au hasard parmi ces individus, il y a 95 % de probabilité que cet individu fasse partie des 95 % "derniers" individus à être né un jour (dans le passé ou le futur). Si l'on prend maintenant comme individu au hasard un individu n contemporain, né aujourd'hui, alors le même raisonnement s'applique si l'on suppose l'équiprobabilité "
Non je ne suppose pas l'équiprobabilité car je n'ai pas choisi au hasard un individu parmi toute l'espèce humaine mais seulement parmi mes contemporains. Il y a donc 95% de probabilité qu'il fasse partie des 95% derniers contemporains pas des 95% derniers humains.

En revanche sur le wiki en anglais, on voit le paradoxe
"Denoting by N the total number of humans who were ever or will ever be born, the Copernican principle suggests that humans are equally likely (along with the other N − 1 humans) to find themselves at any position n of the total population N, so humans assume that our fractional position f = n/N is uniformly distributed on the interval [0, 1] prior to learning our absolute position.

f is uniformly distributed on (0, 1) even after learning of the absolute position n. That is, for example, there is a 95% chance that f is in the interval (0.05, 1), that is f > 0.05. In other words, we could assume that we could be 95% certain that we would be within the last 95% of all the humans ever to be born."

Qu'est ce qui a changé ?
La façon de le dire.
On ne dit plus :
- A qu'en tirant un mec au hasard parmi un ensemble on a 95% de chance qu'il soit dans les 95% dernier mecs de cet ensemble.
mais on dit :
- B que n'importe quel mec d'un ensemble a 95% de chance d'être dans les 95% dernier mecs de cet ensemble.

Alors que A est vrai, B est faux un raccourci de langage probabiliste.
On peut créer maintenant le paradoxe :
si B est vrai pour n'importe quel mec*
alors c'est vrai pour moi**
si c'est vrai pour moi
je peux estimer la taille de l'ensemble à laquelle j'appartiens.


*C'est vrai pour n'importe quel mec tiré au hasard.
**je n'ai pas été tiré au hasard.
Dernière modification par Etienne Beauman le 21 déc. 2016, 11:12, modifié 1 fois.
Au royaume des cyclopes, les borgnes sont aveugles.
Is this a discussion?

Avatar de l’utilisateur
Vathar
Messages : 1014
Inscription : 23 sept. 2016, 15:41

Re: L'Argument de l'Apocalypse

#12

Message par Vathar » 21 déc. 2016, 11:10

Etienne Beauman a écrit :En lisant le wiki français ça reste artificiel
Etienne Beauman a écrit :En revanche sur le wiki en anglais, on voit le paradoxe
Si il faut se coltiner trois sources dans deux langues différentes pour enfin voir le paradoxe énoncé de façon correcte, ca devient un tantinet agaçant.

L'article de vulgarisation ne m'a pas ébloui. J'ai répondu sur l'histoire du disque parce qu'il soulevait des questions. J'ai envie de me pencher un peu sur l'histoire du char Allemand quand j'aurai quelques minutes à tuer, hors du contexte de ce paradoxe.

Pour le wiki français, j'ai plus ou moins décroché après la phrase citée ci-dessus, et pour les meme raisons.

Le wiki anglais, je l'ai pas encore lu et ma motivation à le faire n'est pas colossale, surtout après le résumé qui en a été fait.

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#13

Message par Psyricien » 21 déc. 2016, 14:55

Expliquons plus en détails comment on sort la taille d'une population à partir \(k\) valeur tirées au hasard (approche bayésienne):
Problème : Les membres de la population \(A\) possèdent un identifiant, \(x\), uniformément distribué sur l'intervalle \([0,N]\). On tire aléatoirement \(k\) membres parmis cette population (chaque membre à la même probabilité d'être choisi).
PS : je me met volontairement dans un cas "continue" qui est plus simple à traiter ... mais au demeurant, c'est pareil dans un cas ou \(x\) est discret.

On note \(x\) le numéro de chaque membre de la population, \(P(x) = 1/N\).
On note \(y = {\rm max}(x)\), le numéro maximum parmis les \(k\) membres tiré.
Alors \(P(y|N) = \left( \frac{y}{N} \right)^{k-1} \frac{k}{N}\),
Cette formule est très intuitive, le premier terme correspond au \(k-1\) membres qui ne sont pas le "max" et qui donc une valeur \(x < y\), avec une proba \(P(x < y) = y/N\), et le second terme correspond à la probabilité propre du "max" \(1/N\) multiplié par la multiplicité des combinaison, chaque membres peut être le "max", d'où un facteur \(k\).
On vérifie aisément que \(\int^N_0 P(y|N) {\rm d}y = 1\).

On veux maintenant \(P(N|y) = \frac{P(y|N)P(N)}{P(y)}\)
\(P(N)\) est suposé uniforme sur l'intervalle \([0,\infty[\).
\(P(y) = B\), c'est ce que l'on observe ... on le pose donc égale à une constante indépendante de \(y\) et \(N\).
\(P(N|y) = \frac{1}{C} \left( \frac{y}{N} \right)^{k-1} \frac{k}{N}\),
avec \(C\) une constante de normalisation tel que \(\int_y^{\infty} P(N|y) {\rm d}N = 1\).
On trouve aisément \(C = \frac{k}{k-1}\).
Donc
\(P(N|y) = \left( \frac{y}{N} \right)^{k-1} \frac{k-1}{N}\) (ce qui illustre que l'on ne peux naïvement retourner la probabilité sans la normaliser proprement).
On remarque déjà que le cas \(k=1\) pose problème ... puisque on ne peux pas estimer \(P(N|y)\).

Certes nous avons la proba, calculons l'espérance:
\(E(N) = \int^\infty_y N P(N|y) {\rm d}N = y \frac{k-1}{k-2}\),
La borne inférieur d'intégration est données par la valeur de \(y\), car par construction \(P(N < y|y) = 0\).
On voit alors que pour avoir une espérance définie il faut au moins \(k=3\)

Calculons aussi la variance du truc:
\(E(N^2) = \int^\infty_y N^2 P(N|y) {\rm d}N = y^2 \frac{k-1}{k-3}\),
et donc
\(V(N) = E(N^2) - E(N)^2 = y^2 \frac{k-1}{(k-2)^2 (k-3)}\)
et l'écart type:
\(\sigma(N) = \frac{y}{k-2} \sqrt{\frac{k-1}{k-3}}\),
Pour avoir un écart type non-infini il faut donc au moins \(k=4\).

Autant dire qu'estimer la taille d'une population avec 1 seul éléments peux donc prêter à sourire :).
Par ailleurs, dans le cas de la population humaine, ce que l'on pourrait estimer de la sorte c'est la taille de la population jusqu'à aujourd'hui ... et pas la taille total de la population (puisque les personne prises au hasard ne le serait pas sur l'intervalle total, mais serait borné au présent !).


Petit développement simple qui l'illustre l'inanité du dit "paradox" :lol: .
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#14

Message par Psyricien » 21 déc. 2016, 22:38

Petit complément sur l'approche fréquentiste ... ou comme j'aime à le dire: "l'approche des bayesiens qui s'ignorent" :lol: .

Comme le liens le détail, le fréquentiste arrive à un estimateur de la forme 95% de chance que la taille de la population soit 20 fois plus grand que le nombre mesuré.
D'où viens ce chiffre ?
Tout d'abords commençons avec une lapalissade: Il y a 95% de chances de faire parti des 95% de la population ... bravo monsieur le fréquentiste !!! :roll:
De façon plus générale, on peux dire que pour le fréquentiste il y a:
\(1-\frac{x}{N}\) de chances d'être plus grand que \(x\) (pour une probabilité \(P(x|N)\) uniforme).
avec \(x\) la valeur mesurée au sein de la population et \(N\) la taille de l'échantillon.

La probabilité \(P(N|x)\), s'obtient alors en dérivant \(1-\frac{x}{N}\) (qui est en fait un cumulatif de la distribution) par rapport à \(N\).
Et donc:
\(P(N|x) = \frac{x}{N^2}\).
On remarque que l'on a bien \(\int^\infty_x P(N|x) {\rm d}N = 1\).

Cool ... maintenant que l'on n'a la distribution, on peux faire de la stat:
Regardons l'espérance:
\(E(N) = \int_x^{\infty} N P(N|x) {\rm d}N = \infty\).
Oups, ça part mal, l'espérance du truc diverge :(. Il en va de même (obviously) pour la variance.

Alors il sort d'où ce "meilleur estimateur" de la taille de la population qui est \(2x\) ?
En fait, il ne s'agit pas d'une espérance, mais d'une médiane (le moment où l'intégrale de \(P(N|x)\) est égale à \(1/2\))
Calculons:
\(\int^m_x P(N|x) {\rm d}N = 1/2\),
L'inconnue étant \(m\).
on a donc,
\(1-\frac{x}{m} = 1/2\)
et on retrouve \(m = 2x\).

L'incertitude (écart-type) sur cet estimateur est cependant toujours infini :(. Bref ça sent toujours le pâté.
Alors, quel sont les différence avec l'approche bayésienne que je proposais précédemment ? Pour laquelle la distribution \(P(N|x)\) n'était pas calculable pour 1 seule valeur mesurée ? Alors qu'ici \(P(N|x) = \frac{x}{N^2}\).

L'élément clé est dans la première phrase de mon post, le fréquentiste est un bayésien qui s'ignore. Le fréquentiste, il met des priors "sans s'en rendre compte", et du coup il oublie qu'il en a mis ... et il crois donc que ces proba sont "prior"-indépendant ... que-neni.

Ici, le fréquentiste fait sont estimation avec un prior uniforme sur \(x\), hors de part la relation qui lie \(x\) et \(N\) avoir un prior uniforme sur \(x\) implique d'avoir un prior sur \(N\) de la forme \(P(N) = 1/N\) (la fameuse relation: \(1-\frac{x}{N}\)).
En effet, si on suppose \(N\) comme la variable, alors les valeurs possible d'observer pour la mesure \(x\) ne sont pas uniforme. Les petite valeurs de \(x\) sont possible pour un plus grand nombre de valeur de \(N\) que les grandes valeurs. Ainsi, un prior plat sur \(N\) se traduit par une distribution non-uniforme des valeurs que peut prendre la mesure \(x\) et cela même si \(P(x|N)\) est uniforme :).

Si on reprend la version bayésienne (pour \(k=1\), voir mon post précédent):
\(P(N|x) = P(x|N)\frac{P(N)}{P(x)}\),
\(P(x)\) est toujours une constante, c'est ce que l'on mesure.
\(P(N) = 1/N\), le prior inconscient des fréquentistes
\(P(x|N) = 1/N\), la distribution uniforme de \(x\).
On trouve alors:
\(P(N|x) = \frac{C}{N^2}\), où \(C\) est la constante qui normalise l'intégrale de \(P(N|x)\).
Ici \(C = x\).
Et l'on retrouve la probe des "fréquentistes" avec une approche bayésienne en étant conscient du prior mit sur la valeur de \(N\).


Maintenant mon point de vue, quel est la meilleur approche ?
--> L'approche bayésienne (prior plat sur \(N\))
--> L'approche fréquentiste (équivalent avec une approche bayésienne avec un prior en \(1/N\) sur \(N\))
Je choisis personnellement la première. Car ce que l'on veux estimer c'est \(N\), il fait donc plus de sens d'avoir un prior "plat" sur ce paramètre.

Qu'est ce qui est le mieux
--> la moyenne (espérance)
--> la médiane (50% de la distribution)
Les deux sont équivalent pour une distribution symétriques, elles demeurent toute deux utiles, mais sont fondamentalement différentes dès que l'on regarde des distribution asymétrique (comme c'est le cas ici). Il suffit juste de savoir de quoi l'on parle et du sens à lui donné:
--> la moyenne dont la sommes des valeurs que peut prendre la variable pondérée par leur probabilités
--> La médiane donne la valeurs qui sépare les valeurs possibles en deux ensembles contenant le même nombre d'éléments.

Pour conclure à nouveau, quand on fait des proba, on met toujours un prior (explicite ou non, un prior plat est toujours un prior), il faut vivre avec (et si possible savoir ce que l'on fait). Aussi dans le cas présent, l'essentielle à retenir c'est que pour les deux approches:
--> prior plat et moyenne
--> prior \(1/N\) et médiane
on arrive à des estimateurs dont l'écart-type est infini (si on utilise une seule mesure).
Ce qui explique pourquoi le propos tenu dans les articles cités est non-avenu. Car non, on ne peux pas sortir (de façon fiable) la taille d'une population à partir d'une seule valeur tiré uniformément dans cette population (sauf à mettre un prior délirant sur la taille de la dites population ... et donc la contrainte vient du prior pas de la mesure).

De même, ce problème est une mauvaise analogie pour ce qui est de la taille de l'espèce humaine:
--> Pour l'espèce humaine on ne peux pas supposer que le tirage est uniforme ... car on n'a pas accès à toute la population.
--> Si le "deuxième humain" (même si biologiquement cette considération fait environ 0 sens :roll: ) avait tenu le même raisonnement, il aurait conclu que à 95% l'espèce humaine allait compter 40 membres ;) ... voyez le niveau de pertinence de la dite logique :lol: .

Bref si il y a une chose à retenir de tout mon laïus statistique, c'est que prétendu paradoxe n'en est un que pour ceux qui ont une vision superficielle des stats ... et ne comprenne pas vraiment ce qu'ils font quand il jouent avec des théorèmes dont ils n'ont surement jamais digéré l'origine ... ce qui hélas inclus bon nombre de chercheurs ... supposément "fiables" :(.
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

thewild
Messages : 3301
Inscription : 09 août 2016, 16:43

Re: L'Argument de l'Apocalypse

#15

Message par thewild » 09 janv. 2017, 17:25

Psyricien a écrit :
drzinn a écrit :, et je bloque toujours sur le pourquoi je devrai changer de rideau après qu'on m'ait dit qu'il n'y avait rien derrière le rideau C).
Très simple:
1) Quand tu fait un choix parmis 3 propositions (dont une seule est bonne) tu as 1/3 d'avoir bon.
2) Quand l'un des deux choix restant est révélé comme faux. Cela implique que le rideau non-dévoilé à 1 chance sur 2 d'être le bon.
3) Hors tu as choisi au début avec une 1/3 d'avoir bon, changer ton choix monté tes chances à 1/2.
Cela reste des proba, et changer de "rideau" peut quand même te faire perdre au final, mais tes chances seront meilleures :).
1) Oui
2) C'est n'est pas énoncé assez précisément. C'est "parmi les deux choix restant on en révèle un, obligatoirement faux". Mais ça change tout, car du coup c'est 2/3, pas 1/2.
3) Non, ça monte à 2/3, ou alors ça n'a pas de sens parce que ça signifierait que rester sur son choix est aussi à 1/2, et donc rester ou changer auraient la même espérance mathématique, ce qui n'est pas le cas.

Donc 1 chance sur 3 en restant sur sa porte, 2 chances sur 3 en changeant.

Pour drzinn, qui veut la version intuitive de l'histoire, il faut énumérer. On peut le calculer avec le théorème de Bayes mais c'est comme ça que le pourquoi de la chose échappe.
Donc si on veut comprendre et ne pas se dire "mais pourquoi ??", il suffit de considérer les cas possibles :
- cas 1 : le bon rideau a été choisi dès le départ (1 cas sur 3) : peu importe le rideau révélé ensuite si je change je suis sûr de perdre.
- cas 2 : un mauvais rideau à été choisi au départ (2 cas sur 3) : seul le mauvais rideau restant peut être révélé, donc si je change je suis sûr de gagner

Si j'avais raison au départ je perds (1 cas sur 3), si j'avais tort au départ je gagne (2 cas sur 3). Donc il faut changer.
Donc pas si compliqué si on prend le temps d'énumérer, et tout à fait intuitif.
"Assurons nous bien du fait, avant de nous inquiéter de la cause." Bernard Le Bouyer de Fontenelle

"Plus un fait est extraordinaire, plus il a besoin d'être appuyé de fortes preuves." Pierre Simon Laplace

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: L'Argument de l'Apocalypse

#16

Message par Psyricien » 09 janv. 2017, 22:23

thewild a écrit :
Psyricien a écrit :
drzinn a écrit :, et je bloque toujours sur le pourquoi je devrai changer de rideau après qu'on m'ait dit qu'il n'y avait rien derrière le rideau C).
Très simple:
1) Quand tu fait un choix parmis 3 propositions (dont une seule est bonne) tu as 1/3 d'avoir bon.
2) Quand l'un des deux choix restant est révélé comme faux. Cela implique que le rideau non-dévoilé à 1 chance sur 2 d'être le bon.
3) Hors tu as choisi au début avec une 1/3 d'avoir bon, changer ton choix monté tes chances à 1/2.
Cela reste des proba, et changer de "rideau" peut quand même te faire perdre au final, mais tes chances seront meilleures :).
1) Oui
2) C'est n'est pas énoncé assez précisément. C'est "parmi les deux choix restant on en révèle un, obligatoirement faux". Mais ça change tout, car du coup c'est 2/3, pas 1/2.
3) Non, ça monte à 2/3, ou alors ça n'a pas de sens parce que ça signifierait que rester sur son choix est aussi à 1/2, et donc rester ou changer auraient la même espérance mathématique, ce qui n'est pas le cas.

Donc 1 chance sur 3 en restant sur sa porte, 2 chances sur 3 en changeant.
Correct, je devais avoir la tête dans le cul en écrivant cela :).

G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit