Statistiques, un outils magique !

Tout sur les sciences, que ce soit la chimie, la biologie, l'astronomie etc.
Avatar de l’utilisateur
Cogite Stibon
Messages : 3300
Inscription : 16 févr. 2012, 13:19

Re: Statistiques, un outils magique !

#26

Message par Cogite Stibon » 28 févr. 2013, 12:30

Je crois que je commence aussi à comprendre.
Psyricien a écrit :la propos, qui justement suppose l'existence d'une valeur \bar{X}, dont X_1 et X_2 sont respectivement 2 mesures avec respectivement une incertitude de 0.5 et 0.1.
Donc, si je reformule pour être sûr d'avoir bien compris :
Je veux connaître une valeur \(\bar{X}\)
Pour cela, je fait plusieurs séries de mesures : \(X_1\), \(X_2\),... \(X_i\), etc.
J'obtiens, pour chaque série de mesure, deux valeurs : \(X_i\) qui est la moyenne du résultat de chaque mesure, et [\sigma_i] qui est son écart type.

Si j'obtiens, comme dont mon exemple mal adapté, des différences entre les \(X_i\) très grandes par rapport aux [\sigma_i], c'est mon système de mesure qui est bon à revoir.

Pour estimer \(\bar{X}\), on pourrait utiliser une moyenne simple :\(\bar{X} = \frac{\sum X_i }{ N}\), où N est le nombre de série de mesures.

J'aurais plutôt tendance à utiliser \(\bar{X} = \frac{\sum X_i N_i}{\sum Ni}\), où Ni est le nombre des mesures de la série Xi, sauf si j'ai toujours le même nombre de mesure dans chaque série.

Mais la formule qui minimise la variance est celle donnée plus haut.

C'est bien ça ?

Cogite

Ps : les balises tex "mangent" les "+", ce qui rends les dernières formules Psyricien incompréhensibles, sauf si on regarde le code. Par exemple, quand Psyricien écrit
Psyricien a écrit :Aussi, l'estimateur de la moyenne X_3 = \frac{X_1+X_2}{2} est lui aussi non biaisé ,si vous faite des simulations comme il convient :
Je vois s'afficher \(X_3 = \frac{X_1+X_2}{2}\), que je lis comme X3=(X1 x X2 ) / 2 au lieu de X3 = (X1 + X2) /2 qu'il a écrit
Pour les échantillons statistiques, comme dans d'autres domaines, il n'y a pas que la taille qui compte.
Raisonner a l'instinct sur des problemes de probabilites, c'est le desastre assuré. (Spin Up)
Une graphe sans échelle, c'est bon pour la poubelle

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: Statistiques, un outils magique !

#27

Message par Psyricien » 28 févr. 2013, 15:40

Ps : les balises tex "mangent" les "+", ce qui rends les dernières formules Psyricien incompréhensibles, sauf si on regarde le code. Par exemple, quand Psyricien écrit
Psyricien a écrit :Aussi, l'estimateur de la moyenne X_3 = \frac{X_1+X_2}{2} est lui aussi non biaisé ,si vous faite des simulations comme il convient :
Je vois s'afficher \(X_3 = \frac{X_1+X_2}{2}\), que je lis comme X3=(X1 x X2 ) / 2 au lieu de X3 = (X1 + X2) /2 qu'il a écrit
Ouaip ... pour faire un + faut mettre "%2b" ...
Cogite Stibon a écrit :Je crois que je commence aussi à comprendre.
Psyricien a écrit :la propos, qui justement suppose l'existence d'une valeur \bar{X}, dont X_1 et X_2 sont respectivement 2 mesures avec respectivement une incertitude de 0.5 et 0.1.
Donc, si je reformule pour être sûr d'avoir bien compris :

Je veux connaître une valeur \(\bar{X}\)
Pour cela, je fait plusieurs séries de mesures : \(X_1\), \(X_2\),... \(X_i\), etc.
J'obtiens, pour chaque série de mesure, deux valeurs : \(X_i\) qui est la moyenne du résultat de chaque mesure, et [\sigma_i] qui est son écart type.
Nop, chaque \(X_i\) est une seul mesure ayant une incertitude associé de \(\sigma_i\). faisant ainsi que chaque \(X_i\) peut-être écrit :
\(X_i = \bar{X} + N_i\)
Avec \(N_i\) un variable aléatoire de standard déviation \(\sigma_i\)

Si j'obtiens, comme dont mon exemple mal adapté, des différences entre les \(X_i\) très grandes par rapport aux [\sigma_i], c'est mon système de mesure qui est bon à revoir.
En effet si les différentes mesure ne sont pas "en accord" eu égard à la taille des barre d'erreur ... il y a un soucis quelque par:
-->Soit l'hypothèse initiale est fausse
-->Soit certaines mesure sont biaisé
-->Soit les barres d'erreur sont sous-estimé

Pour testé l'accord entre des mesure à un model sachant les barre d'erreur on peut utiliser le test du \(\chi^2\) (valable si les barre d'erreur sont gaussienne)


@+,
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Dave
Messages : 393
Inscription : 15 sept. 2011, 04:30

Re: Statistiques, un outils magique !

#28

Message par Dave » 03 mars 2013, 03:52

Bonjour!


J'admets que je suis hors sujet, mais je me permets tout de même de vous poser une petite question. J'ai longtemps hésité à vous la poser, car j'ai l'impression que la réponse est très évidente et je me sens un peu stupide de ne pas la trouver. J'ai décidé de piler sur mon orgueil. Ça m'apparait une question de logique.


Soient E et F deux ensembles vides.
Par définition, on a pour tout x, x n'est pas élément de E d'où, pour tout x, x est élément de E implique que x est élément de F.(*)
Donc, E est inclus dans F. Par symétrie de rôles entre E et F, il s'ensuit que F est inclus dans E, donc E = F.

Il existe aussi une preuve plus technique qui me semble différente de celle-ci. J'ai trouvé cette présente preuve de l'unicité de l'ensemble vide sur Internet et je ne connaissais pas ce genre de preuve qui en est une par « artifice » si j'ose dire. Je suis loin d'être un expert dans la théorie des ensembles, mais je crois saisir l'idée de la preuve qui est somme toute assez simple à comprendre. Dans mon esprit, nul doute que l'ensemble vide est unique. Par contre, je n'arrive pas à bien expliquer l'argument incontestable de ce fait pour bien contrer les critiques de ceux qui croient fortement que l'ensemble vide est mal défini ou incohérent. Est-ce que la preuve présentée ci-dessus suffit à elle seule à démontrer hors de tout doute l'unicité de l'ensemble vide ou doit-on présenter une preuve plus technique? Le contre-argument que je n'arrive pas à contrer est celui de dire :

Soient E et F deux ensembles vides. Par définition, on a pour tout x, x n'est pas élément de E d'où, pour tout x, x est élément de E implique que x N'EST PAS élément de F.(*) Donc, E N'EST PAS inclus dans F. Il s'ensuit que E ≠ F.

Ainsi, on a à la fois E = F et E ≠ F.


Merci d'avance pour vos explications.



(*) En effet, la proposition P implique Q est vraie si P est toujours faux.

Avatar de l’utilisateur
Cogite Stibon
Messages : 3300
Inscription : 16 févr. 2012, 13:19

Re: Statistiques, un outils magique !

#29

Message par Cogite Stibon » 04 mars 2013, 12:55

Psyricien a écrit : Nop, chaque \(X_i\) est une seul mesure ayant une incertitude associé de \(\sigma_i\). faisant ainsi que chaque \(X_i\) peut-être écrit :
\(X_i = \bar{X} + N_i\)
Avec \(N_i\) un variable aléatoire de standard déviation \(\sigma_i\)
Ok, mais comment évalue-t'on alors chaque \(\sigma_i\) ?
Pour les échantillons statistiques, comme dans d'autres domaines, il n'y a pas que la taille qui compte.
Raisonner a l'instinct sur des problemes de probabilites, c'est le desastre assuré. (Spin Up)
Une graphe sans échelle, c'est bon pour la poubelle

Avatar de l’utilisateur
Psyricien
Messages : 3426
Inscription : 31 oct. 2011, 18:27

Re: Statistiques, un outils magique !

#30

Message par Psyricien » 04 mars 2013, 14:34

Cogite Stibon a écrit :
Psyricien a écrit : Nop, chaque \(X_i\) est une seul mesure ayant une incertitude associé de \(\sigma_i\). faisant ainsi que chaque \(X_i\) peut-être écrit :
\(X_i = \bar{X} %2b N_i\)
Avec \(N_i\) un variable aléatoire de standard déviation \(\sigma_i\)
Ok, mais comment évalue-t'on alors chaque \(\sigma_i\) ?
Cela dépend des cas.
Une approche purement empirique, peut-être l’emploie de sous ensemble de données, afin de faire un estimer du niveau d'incertitude.

Par exemple pour moi qui utilise des cartes du ciel. Un solution peut-être de prendre une cartes fait avec la moitié des données, puis une seconde avec l'autre moitié (en prenant garde à ce que les deux cartes présentes les même propriété de couverture du ciel, et les même propriétés statistiques en générales).
Et au lieu de faire leur sommes pour réduire mes incertitudes, je peut faire leur différence (ce qui nettoie le signal, ne laissant que le bruit non-corrélé (pour estimer les partie corrélé dans le bruit, c'est un sport autrement plus complexe) entre mes deux sous ensembles de données). Ainsi, je peut avoir une estimation de mon niveau de bruit par région du ciel (un \(\sigma_i\) par pixel \(i\))
Après dans de nombreux cas, on se trouve dans une situation où \(\sigma_i\) est constant par rapport à \(i\), mais ce n'est pas le cas générale.

Une approche peut être une approche purement analytique. Supposons que je connaisse bien mon instruments de mesure, je connait son niveau de bruit (peut être estimé en prenant des mesure à sans signal), rien ne m’empêche de directement propager ces incertitudes (connu) à mon analyse.

C'est un peu du cas par cas ... on fait au mieux avec ce que l'on as sous la main. A chaque situation son analyse dédiée.

Petit teaser pour la prochaine "weirdité" du monde des statistiques: "Les moindres carrés c'est cool, mais en vrai ça marche toujours ?".
Publication: surement dans la semaine (au grès du temps que j'ai à y accorder :) ).

@+,
G>
Psyricien : La moyenne de 4 et 5 ça peut faire 3 ... Comprendra qui pourra !

Avatar de l’utilisateur
Cogite Stibon
Messages : 3300
Inscription : 16 févr. 2012, 13:19

Re: Statistiques, un outils magique !

#31

Message par Cogite Stibon » 04 mars 2013, 18:07

Ok, j'ai (enfin) compris. Merci pour les explications.
J'ai fait une simulation pour voir, avec des données aléatoires. Ta formule donne effectivement une meilleure approximation de X, et d'autant meilleure que l'écart entre les incertitudes est grand.

J'ai hâte de lire ton paradoxe sur les moindres carrés. Quand je discute stats avec des collègues, je suis généralement réduit à donner des explications du genre :
"Si tu as fait 100 000 ventes en boutique, avec un panier moyen à 100 euros, et 10 00 ventes sur le web avec un panier moyen à 200 euros, le panier moyen global n'est pas de 150 euros".
Pour les échantillons statistiques, comme dans d'autres domaines, il n'y a pas que la taille qui compte.
Raisonner a l'instinct sur des problemes de probabilites, c'est le desastre assuré. (Spin Up)
Une graphe sans échelle, c'est bon pour la poubelle

Dave
Messages : 393
Inscription : 15 sept. 2011, 04:30

Re: Statistiques, un outils magique !

#32

Message par Dave » 22 déc. 2013, 20:50

Dave a écrit :J'admets que je suis hors sujet [...] Soient « E et F » deux ensembles vides. Par définition, on a « pour tout x, x n'est pas élément de E » d'où, « pour tout x, x est élément de E implique que x N'EST PAS élément de F ». Donc, (** Faux!) E N'EST PAS inclus dans F
Bon, je reviens sur ma propre question pour y répondre et clore sur un sujet qui intéressait autant de personnes que le nombre d'éléments dans l'ensemble de l'ensemble vide. En fait, l'erreur était simplement de confondre la négation d'une implication avec la négation de sa deuxième proposition « q » (dans « p » implique « q »).

En effet, pour conclure qu'un ensemble vide n'est pas inclus dans un autre ensemble vide, il aurait fallu prouver que la négation de l'implication (présente dans la définition de l'inclusion) est vraie, autrement dit, ici, que « x est élément de E et x n'est pas élément de F » est vraie. Or, ici, « x est élément de E » est toujours faux, ce qui fait que la conjonction (et donc la négation de l'implication en question) est automatiquement fausse. Ainsi, contrairement à ce qui était prétendu (Voir ** Faux!), on n'a évidemment pas prouvé que « E n'est pas inclus dans F » (au contraire, heureusement), et ce, malgré le fait que la proposition « x est élément de E implique que x n'est pas élément de F » soit vraie, malgré donc une apparence qui peut sembler dire le contraire à première vue.

Avatar de l’utilisateur
Brigand
Messages : 1129
Inscription : 16 juin 2013, 01:41

Re: Statistiques, un outils magique !

#33

Message par Brigand » 23 déc. 2013, 01:00

Dave a écrit :Bon, je reviens sur ma propre question pour y répondre et clore sur un sujet qui intéressait autant de personnes que le nombre d'éléments dans l'ensemble de l'ensemble vide.
Non, c'est cool, j'ai découvert un fil intéressant!


-------------------------
Psyricien a écrit : On remarquera que dans l'ordre j'ai choisit les approches:
-Bourrin
-Feignant
-Intelligent
J'ai procédé pareil, sauf qu'à l'étape deux, j'étais trop feignant pour faire une simulation. Alors je suis passé direct à la phase trois intelligente: lire la réponse juste de la part de Psyricien. :mrgreen:
.
"Lourd est le parpaing de la réalité sur la tartelette aux fraises de nos illusions." - Boulet

Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit