Problèmes
Exercice 1 (Test du signe) On observe \(n\) couples aléatoires \((X_1,Y_1), (X_2,Y_2), \dots, (X_n,Y_n)\) indépendants mais pas nécessairement de même loi. On suppose de plus que les variables \(X_i\) et \(Y_i\) sont indépendantes et qu’elles ont une loi diffuse pour tout \(i\in\{1,\dots,n\}\). On considère le test des hypothèses \[ \begin{array}{@{}cl} H_0: &\text{$X_i=Y_i$ en loi pour tout $i$}, \\ H_1: & \text{il existe $i\not=j$ tels que $X_i\not=Y_i$ en loi}. \end{array} \]
- Montrer que \(P\left(X_i=Y_i\right)=0\) et en déduire que sous \(H_0\), on a \(P\left(X_i > Y_i\right) = \frac{1}{2}.\)
- On pose \(N = \sum_{i = 1}^n \mathbf{1}_{X_i>Y_i}.\) Quelle est la loi de \(N\) sous \(H_0\) ?
- En déduire que le test défini par la région de rejet \[\left\{\left|N-\frac{n}{2}\right| \geq c\right\}\] permet de construire un test de niveau inférieur à \(\alpha \in \,]0,1[\) de \(H_0\) contre \(H_1\) pour un choix \(c=c(\alpha) >0\) que l’on précisera. Parmi tous les choix possibles de \(c(\alpha)\), lequel préférer ?
- Les moyennes générales de la première et de la deuxième année de cinquième de \(12\) redoublants ont été relevées:
Élève | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Année 1 | 12.0 | 9.5 | 13.0 | 10.0 | 8.5 | 11.0 | 7.8 | 14.0 | 5.0 | 12.0 | 12.0 | 8.6 |
Année 2 | 6.1 | 14.0 | 7.3 | 7.3 | 13.0 | 17.0 | 14.0 | 9.2 | 12.0 | 14.0 | 8.8 | 8.8 |
Le redoublement a-t-il une influence sur la moyenne générale ? 1
Exercice 2 (Test de gaussianté de Jarque-Bera) Soit \((X_1,\dots, X_n)\) un \(n\)-échantillon de loi inconnue \(F\) ayant au moins un moment d’ordre \(4\) et de moyenne nulle et de variance non nulle.
- On pose, pour \(k= 1, \dots, 4,\) \[T_n^{(k)} = \frac{\tfrac{1}{n}\sum_{i = 1}^n X_i^k}{\big(\tfrac{1}{n}\sum_{i = 1}^n X_i^2\big)^{k/2}}.\] Montrer que si \(F\) est une distribution gaussienne, on a la convergence en loi suivante : \[\frac{n}{15}\left (T_n^{(3)}\right )^2+\frac{n}{96}\left(T_n^{(4)}-3\right)^2 \to \chi^2_2\]
- En déduire un test de l’hypothèse nulle \(H_0:\) « \(F\) est gaussienne » contre l’alternative \(H_1:\) « \(F\) n’est pas gaussienne ».
- Le test est-il convergent ?
Exercice 3 (Test exact de Fisher) On reprend l’exercice Exercice 10, mais cette fois la table de contingence des observations est la suivante :
riche | pauvre | ||
---|---|---|---|
heureux | 1 | 9 | |
triste | 11 | 3 |
On cherche à tester si l’argent et le bonheur sont deux dimensions indépendantes (hypothèse nulle).
- Un test du \(\chi_2\) d’indépendance est-il adapté cette fois ?
- On suppose que le total de chaque ligne et de chaque colonne est fixé. Montrer que sous l’hypothèse nulle, la vraisemblance d’une table de contingence de la forme \[t=\begin{bmatrix} a && b \\ c && d \end{bmatrix}\] est égale à \[p = \frac{\binom{a+b}{a}\binom{c+d}{c}}{\binom{24}{a+c}}. \] On a supposé que \(a+b = 10, c+d = 14, a+c=11, b+d=12\). Pour la table ci-dessus, on trouve \(p = 0.001346\).
- La notion de quantile a peu de sens pour une loi comme ci-dessus2. On remplace donc cette notion par la suivante : si \(p(t)\) est la probabilité, sous l’hypothèse nulle, d’observer une table \(t\), alors on ordonne toutes les tables possible \(t_1, \dotsc, t_2, \dots\) par probabilité croissante. On pose \(n_\alpha = \sup\{k : p(t_1) + \dotsb + p(t_k)<\alpha\}\). Montrer que le test dont la région de rejet est \(\{t_1, \dotsc, t_{n_\alpha}\}\) est un test de niveau de confiance au moins \(1-\alpha\) de l’hypothèse nulle.