Probabilités conditionnelles

Vue d'ensemble

Les probabilités conditionnelles formalisent une idée intuitive mais piégeuse : « sachant qu'un événement $B$ s'est produit, quelle est la probabilité de $A$ ? ». Elles ouvrent la voie aux deux théorèmes les plus utilisés du chapitre — la formule des probabilités totales et la formule de Bayes — et conduisent à la notion d'indépendance, cœur du raisonnement probabiliste. Cette fiche regroupe les 5 théorèmes incontournables, les 4 démonstrations à savoir refaire et les pièges (notamment la confusion indépendance 2 à 2 vs mutuelle) qui font perdre des points en colle comme à l'écrit.

Au programme MPSI (officiel) — Probabilité conditionnelle d'un événement

A

sachant

B

(avec

P (B) > 0

P_{B}

est une probabilité sur

Ω

. Formule des probabilités composées. Système complet d'événements. Formule des probabilités totales. Formule de Bayes. Indépendance de deux événements, indépendance mutuelle d'une famille d'événements. Cadre univers fini.

Prérequis

Espace probabilisé fini $(Ω, P)$ : axiomes $P (Ω) = 1$ et additivité finie
Manipulation des événements : réunion $A \cup B$ , intersection $A \cap B$ , complémentaire $\overline{A}$
Système complet d'événements : partition $(B_{i})$ de $Ω$ avec $P (B_{i}) > 0$

🎯 Accompagnement Majorant

Tu confonds $P (A ∣ B)$ et $P (B ∣ A)$ une fois sur deux ? C'est le piège n°1 du chapitre : il fait chuter 1 élève de MPSI sur 2 sur le test diagnostic médical et les exos de Bayes. Nos mentors alumni X · Centrale · Mines remettent les fondations en place en cours particuliers, avec arbres de probabilités et exos sur-mesure tirés de tes propres DS.

Trouver un mentor MPSI →

1. Définitions essentielles

Définition 1.1 — Probabilité conditionnelle

Soient $A$ et $B$ deux événements d'un espace probabilisé fini $(Ω, P)$ tels que $P (B) > 0$ . On appelle probabilité conditionnelle de $A$ sachant $B$ le réel :

P_{B} (A) = P (A ∣ B) = \frac{P ( A \cap B )}{P ( B )} .

Les deux notations $P_{B} (A)$ et $P (A ∣ B)$ sont rigoureusement équivalentes ; la première met en avant le fait que $P_{B}$ est elle-même une probabilité (cf. Théorème 2.1).

⚠ Piège #1 du chapitre — confondre $P (A ∣ B)$ et $P (B ∣ A)$ . Ce sont deux quantités différentes, liées par la formule de Bayes mais jamais égales en général. Exemple culte : test diagnostic. Si

M

= « être malade » et

T

= « test positif », alors

P (T ∣ M)

est la sensibilité du test (souvent élevée,

\approx 0, 99

) tandis que

P (M ∣ T)

est la valeur prédictive positive (souvent bien plus faible quand la maladie est rare). Lis toujours la condition après la barre :

P (A ∣ B)

= «

A

sachant

B

».

Définition 1.2 — Système complet d'événements

Une famille finie $(B_{1}, B_{2}, \dots, B_{n})$ d'événements de $Ω$ est un système complet d'événements si elle forme une partition de $Ω$ , c'est-à-dire :

les $B_{i}$ sont deux à deux incompatibles : $\forall i \neq = j, B_{i} \cap B_{j} = \emptyset$ ,
leur réunion couvre $Ω$ : $i = 1 ⋃ n B_{i} = Ω$ .

On suppose en général que $P (B_{i}) > 0$ pour tout $i$ , afin que les conditionnements $P_{B_{i}}$ soient bien définis.

📝 Cas particulier ultra-classique. Pour tout événement

B

avec

0 < P (B) < 1

, la famille

(B, \overline{B})

est un système complet d'événements. C'est le cas d'usage le plus fréquent de la formule des probabilités totales en exo.

Définition 1.3 — Indépendance de deux événements

Deux événements $A$ et $B$ sont indépendants (pour la probabilité $P$ ) si :

P (A \cap B) = P (A) \cdot P (B) .

Lorsque $P (B) > 0$ , cette condition équivaut à $P_{B} (A) = P (A)$ (cf. Proposition 4.1) : savoir que $B$ est réalisé ne modifie pas la probabilité de $A$ .

Définition 1.4 — Indépendance mutuelle d'une famille

Une famille finie $(A_{1}, A_{2}, \dots, A_{n})$ d'événements est mutuellement indépendante si pour toute sous-partie $I \subset {1, 2, \dots, n}$ non vide, on a :

P (i \in I ⋂ A_{i}) = i \in I \prod P (A_{i}) .

Cette condition doit être vérifiée pour toutes les sous-intersections — pas seulement pour l'intersection totale.

Définition 1.5 — Indépendance deux à deux

Une famille $(A_{1}, \dots, A_{n})$ est indépendante deux à deux si pour tout couple $i \neq = j$ , les événements $A_{i}$ et $A_{j}$ sont indépendants : $P (A_{i} \cap A_{j}) = P (A_{i}) \cdot P (A_{j})$ .

⚠ Piège #2 — Indépendance 2 à 2 vs indépendance mutuelle. L'indépendance mutuelle implique l'indépendance deux à deux (prends

∣ I ∣ = 2

dans la définition), mais la réciproque est FAUSSE. Contre-exemple canonique (Bernstein) : on lance deux pièces équilibrées,

A

= « 1^re pile »,

B

= « 2^e pile »,

C

= « les deux résultats sont identiques ». Les trois sont indépendants deux à deux mais

P (A \cap B \cap C) = 1/4 \neq = P (A) P (B) P (C) = 1/8

. Quand un exo dit « les

A_{i}

sont indépendants », c'est mutuellement — pas 2 à 2.

2. Théorèmes fondamentaux

2.1 — P_B est une probabilité sur Ω

Théorème 2.1 — P_B est une probabilité sur Ω ★ À savoir démontrer

Soit $B$ un événement tel que $P (B) > 0$ . L'application $P_{B} : P (Ω) \to [0, 1]$ définie par $P_{B} (A) = P (A \cap B) / P (B)$ est une probabilité sur $Ω$ : elle vérifie $P_{B} (Ω) = 1$ et l'additivité finie.

Démonstration (vérification des axiomes)

Soit $B$ avec $P (B) > 0$ . On vérifie les axiomes d'une probabilité sur l'univers fini $Ω$ .

(i) Positivité et borne supérieure. Pour tout $A \subset Ω$ , $P (A \cap B) \geq 0$ et $P (B) > 0$ , donc $P_{B} (A) \geq 0$ . De plus $A \cap B \subset B$ donc $P (A \cap B) \leq P (B)$ , soit $P_{B} (A) \leq 1$ . Ainsi $P_{B} (A) \in [0, 1]$ .

(ii) Masse totale. $P_{B} (Ω) = \frac{P ( Ω \cap B )}{P ( B )} = \frac{P ( B )}{P ( B )} = 1$ .

(iii) Additivité finie. Soient $A_{1}, A_{2}$ incompatibles ( $A_{1} \cap A_{2} = \emptyset$ ). Alors $(A_{1} \cap B) \cap (A_{2} \cap B) = (A_{1} \cap A_{2}) \cap B = \emptyset \cap B = \emptyset$ , donc $A_{1} \cap B$ et $A_{2} \cap B$ sont incompatibles. Par additivité de $P$ :

P_{B} (A_{1} \cup A_{2}) = \frac{P ( ( A _{1} \cup A _{2} ) \cap B )}{P ( B )} = \frac{P ( ( A _{1} \cap B ) \cup ( A _{2} \cap B ) )}{P ( B )} = \frac{P ( A _{1} \cap B ) + P ( A _{2} \cap B )}{P ( B )} = P_{B} (A_{1}) + P_{B} (A_{2}) .

Par récurrence immédiate, on obtient l'additivité pour toute famille finie d'événements deux à deux incompatibles. Donc $P_{B}$ est bien une probabilité sur $Ω$ .

📝 Conséquence pratique. Comme

P_{B}

est une probabilité, toutes les règles connues pour

P

s'appliquent à

P_{B}

P_{B} (\overline{A}) = 1 - P_{B} (A)

P_{B} (A_{1} \cup A_{2}) = P_{B} (A_{1}) + P_{B} (A_{2}) - P_{B} (A_{1} \cap A_{2})

, etc. C'est un raccourci précieux en exo.

2.2 — Formule des probabilités composées

Théorème 2.2 — Formule des probabilités composées (2 événements)

Soient $A, B$ deux événements. Si $P (B) > 0$ , alors :

P (A \cap B) = P (B) \cdot P_{B} (A) .

Symétriquement, si $P (A) > 0$ , $P (A \cap B) = P (A) \cdot P_{A} (B)$ . Les deux écritures sont égales — c'est la clé de la formule de Bayes.

Théorème 2.3 — Formule des probabilités composées généralisée

Soient $A_{1}, A_{2}, \dots, A_{n}$ des événements tels que $P (A_{1} \cap A_{2} \cap \dots \cap A_{n - 1}) > 0$ . Alors :

P (A_{1} \cap A_{2} \cap \dots \cap A_{n}) = P (A_{1}) \cdot P_{A_{1}} (A_{2}) \cdot P_{A_{1} \cap A_{2}} (A_{3}) \dots P_{A_{1} \cap \dots \cap A_{n - 1}} (A_{n}) .

C'est la formule qui « descend » naturellement le long d'une branche d'arbre de probabilités.

💡 Exemple canonique — Tirages successifs sans remise. Une urne contient 3 boules rouges et 2 noires. On tire 3 boules sans remise. Quelle est la probabilité

p

de tirer rouge à chaque fois ? Notons

R_{i}

= «

i

-ième boule rouge ». Par probabilités composées :

p = P (R_{1} \cap R_{2} \cap R_{3}) = P (R_{1}) \cdot P_{R_{1}} (R_{2}) \cdot P_{R_{1} \cap R_{2}} (R_{3}) = \frac{3}{5} \cdot \frac{2}{4} \cdot \frac{1}{3} = \frac{1}{10} .

Chaque conditionnement met à jour la composition de l'urne — c'est l'archétype où la formule composée est indispensable.

2.3 — Formule des probabilités totales

Théorème 2.4 — Formule des probabilités totales ★ À savoir démontrer

Soit $(B_{1}, B_{2}, \dots, B_{n})$ un système complet d'événements avec $P (B_{i}) > 0$ pour tout $i$ . Alors, pour tout événement $A$ :

P (A) = i = 1 \sum n P (A \cap B_{i}) = i = 1 \sum n P (B_{i}) \cdot P_{B_{i}} (A) .

Démonstration (partition + additivité)

Comme $(B_{i})_{1 \leq i \leq n}$ est un système complet d'événements, $i = 1 ⋃ n B_{i} = Ω$ et les $B_{i}$ sont deux à deux incompatibles. On écrit alors :

A = A \cap Ω = A \cap (i = 1 ⋃ n B_{i}) = i = 1 ⋃ n (A \cap B_{i}) .

Les événements $(A \cap B_{i})_{1 \leq i \leq n}$ sont eux aussi deux à deux incompatibles : si $i \neq = j$ , $(A \cap B_{i}) \cap (A \cap B_{j}) = A \cap (B_{i} \cap B_{j}) = A \cap \emptyset = \emptyset$ . Par additivité finie de $P$ :

P (A) = P (i = 1 ⋃ n (A \cap B_{i})) = i = 1 \sum n P (A \cap B_{i}) .

Enfin, pour chaque $i$ , $P (B_{i}) > 0$ permet d'écrire $P (A \cap B_{i}) = P (B_{i}) \cdot P_{B_{i}} (A)$ par la formule des probabilités composées, d'où :

P (A) = i = 1 \sum n P (B_{i}) \cdot P_{B_{i}} (A) .

📐 Méthode-type — Utiliser la formule des probabilités totales. Le déclencheur pédagogique : tu connais $P (A)$ conditionnée à certaines situations $B_{i}$ , mais pas $P (A)$ directement. Procédure :

Identifier le système complet pertinent. Le plus souvent $(B, \overline{B})$ , ou « $B_{i}$ = $i$ -ème urne tirée », « $B_{i}$ = état initial », etc.
Vérifier $P (B_{i}) > 0$ pour chaque indice (sinon on conditionne par l'impossible).
Calculer chaque $P_{B_{i}} (A)$ — c'est généralement direct car le conditionnement fixe la situation.
Sommer : $P (A) = \sum_{i} P (B_{i}) \cdot P_{B_{i}} (A)$ .

L'arbre de probabilités (cf. §3) matérialise visuellement cette somme : chaque branche contribue son produit, et on additionne toutes les branches menant à

A

2.4 — Formule de Bayes

Théorème 2.5 — Formule de Bayes ★ À savoir démontrer

Soient $A$ un événement avec $P (A) > 0$ et $(B_{1}, B_{2}, \dots, B_{n})$ un système complet d'événements avec $P (B_{i}) > 0$ pour tout $i$ . Alors, pour tout $j \in {1, \dots, n}$ :

P_{A} (B_{j}) = P (B_{j} ∣ A) = \frac{P ( B _{j} ) \cdot P _{B_{j}} ( A )}{i = 1 \sum n P ( B _{i} ) \cdot P _{B_{i}} ( A )} .

Démonstration (symétrie des probabilités composées + dénominateur via PT)

On part de la double écriture de $P (A \cap B_{j})$ via la formule des probabilités composées (Théorème 2.2) :

P (A \cap B_{j}) = P (A) \cdot P_{A} (B_{j}) = P (B_{j}) \cdot P_{B_{j}} (A) .

Comme $P (A) > 0$ , on isole $P_{A} (B_{j})$ en divisant par $P (A)$ :

P_{A} (B_{j}) = \frac{P ( B _{j} ) \cdot P _{B_{j}} ( A )}{P ( A )} .

Il ne reste qu'à exprimer $P (A)$ au dénominateur grâce à la formule des probabilités totales (Théorème 2.4) appliquée au système complet $(B_{i})$ :

P (A) = i = 1 \sum n P (B_{i}) \cdot P_{B_{i}} (A) .

En substituant, on obtient bien la formule annoncée.

📝 Vocabulaire bayésien (culture utile). Dans

P_{A} (B_{j}) = \frac{P ( B _{j} ) \cdot P _{B_{j}} ( A )}{\sum _{i} P ( B _{i} ) P _{B_{i}} ( A )}

P (B_{j})

est appelée probabilité a priori (avant observation),

P_{A} (B_{j})

la probabilité a posteriori (après avoir observé

A

), et

P_{B_{j}} (A)

la vraisemblance de l'observation sous l'hypothèse

B_{j}

. Bayes est l'outil qui met à jour nos croyances à la lumière des données.

💡 Exemple canonique — Test diagnostic médical. Une maladie touche 1 % de la population. On dispose d'un test avec :

P (T ∣ M) = 0, 99

(sensibilité) et

P (T ∣ \overline{M}) = 0, 05

(taux de faux positifs). Un patient est testé positif : quelle est la probabilité qu'il soit malade ? Le système complet est

(M, \overline{M})

. Bayes :

P (M ∣ T) = \frac{P ( M ) \cdot P _{M} ( T )}{P ( M ) P _{M} ( T ) + P ( M ) P _{\overline{M}} ( T )} = \frac{0 , 01 \times 0 , 99}{0 , 01 \times 0 , 99 + 0 , 99 \times 0 , 05} \approx 0, 167.

Moins de 17 % ! Alors que la sensibilité du test est de 99 %. C'est l'effet contre-intuitif que Bayes rend rigoureux : quand la maladie est rare, les faux positifs dominent. C'est exactement ce qui tombe en colle de proba — assimile l'exemple.

🧑‍🏫 Décortique Bayes avec un mentor

Le test diagnostic, c'est LE classique où 70 % des MPSI se trompent en première lecture. En 1 séance avec un mentor Majorant alumni de l'X ou Centrale, tu maîtrises Bayes pour de bon : arbre, double écriture des composées, lecture vraisemblance/a priori, et variantes (deux tests successifs, mise à jour itérative).

Réserver une séance ciblée →

3. Arbres de probabilités — méthode visuelle

L'arbre est la matérialisation graphique des théorèmes 2.3 (composées généralisées) et 2.4 (probabilités totales). Bien dessiné, il transforme un énoncé verbal en calcul mécanique.

📐 Méthode-type — Construire et exploiter un arbre.

Racine. On part de $Ω$ (univers).
Premier niveau. On choisit un système complet d'événements $(B_{1}, \dots, B_{n})$ ; on dessine $n$ branches étiquetées $P (B_{1}), \dots, P (B_{n})$ .
Deuxième niveau. À l'extrémité de chaque branche $B_{i}$ , on dessine les sous-branches $B_{i} \to A$ et $B_{i} \to \overline{A}$ étiquetées par les probabilités conditionnelles $P_{B_{i}} (A)$ et $P_{B_{i}} (\overline{A}) = 1 - P_{B_{i}} (A)$ .
Probabilité d'un chemin (probabilités composées). On multiplie les étiquettes le long du chemin : $P (B_{i} \cap A) = P (B_{i}) \cdot P_{B_{i}} (A)$ .
Probabilité d'un événement final (probabilités totales). On somme les probabilités de tous les chemins menant à cet événement : $P (A) = \sum_{i} P (B_{i}) \cdot P_{B_{i}} (A)$ .

Règle de cohérence : la somme des probabilités des branches partant d'un même nœud vaut toujours

1

. Si ce n'est pas le cas, tu as oublié une branche ou mal lu l'énoncé.

⚠ Piège #3 — Étiquette sur la première branche vs étiquette sur la seconde. La première branche porte une probabilité non conditionnée

P (B_{i})

; les branches du deuxième niveau portent des probabilités conditionnelles

P_{B_{i}} (A)

, pas

P (A \cap B_{i})

. C'est l'erreur fréquente qui fait écrire

P (A) = \sum P (A \cap B_{i}) \cdot P (B_{i})

(faux d'un facteur

P (B_{i})

en trop). Garde en tête : les branches profondes sont conditionnées.

💡 Exemple — Arbre pour les deux urnes. Deux urnes :

U_{1}

contient 2 blanches et 3 noires,

U_{2}

contient 4 blanches et 1 noire. On choisit une urne au hasard (équiprobable) puis on tire une boule.

B

= « blanche ». Système complet :

(U_{1}, U_{2})

P (U_{1}) = P (U_{2}) = 1/2

. Probabilités conditionnelles :

P_{U_{1}} (B) = 2/5

P_{U_{2}} (B) = 4/5

. Probabilités totales :

P (B) = \frac{1}{2} \cdot \frac{2}{5} + \frac{1}{2} \cdot \frac{4}{5} = \frac{6}{10} = \frac{3}{5} .

Bayes (la boule est blanche, urne probable ?) :

P (U_{2} ∣ B) = \frac{( 1/2 ) ( 4/5 )}{3/5} = \frac{2}{3}

— l'observation « blanche » a poussé notre croyance vers

U_{2}

, qui contient plus de blanches.

4. Indépendance — caractérisations et subtilités

Proposition 4.1 — Caractérisation de l'indépendance par le conditionnement ★ À savoir démontrer

Soient $A, B$ deux événements avec $P (B) > 0$ . Alors :

A et B sont ind \overset{e}{ˊ} pendants ⟺ P_{B} (A) = P (A) .

Démonstration (équivalence directe)

Supposons $P (B) > 0$ .

(⇒) Si $A$ et $B$ sont indépendants, alors par définition $P (A \cap B) = P (A) \cdot P (B)$ . En divisant par $P (B) > 0$ :

P_{B} (A) = \frac{P ( A \cap B )}{P ( B )} = \frac{P ( A ) \cdot P ( B )}{P ( B )} = P (A) .

(⇐) Réciproquement, si $P_{B} (A) = P (A)$ , alors par définition de $P_{B}$ :

\frac{P ( A \cap B )}{P ( B )} = P (A) ⟺ P (A \cap B) = P (A) \cdot P (B),

ce qui est exactement la définition de l'indépendance de $A$ et $B$ . On a bien l'équivalence.

📝 Lecture sémantique. L'équivalence ci-dessus dit que l'indépendance est exactement la non-modification de la probabilité par le conditionnement. C'est l'intuition centrale : « savoir que

B

s'est produit ne change pas la chance de

A

». Symétriquement, si

P (A) > 0

, l'indépendance équivaut à

P_{A} (B) = P (B)

Proposition 4.2 — Stabilité par complémentation

Si $A$ et $B$ sont indépendants, alors les couples $(A, \overline{B})$ , $(\overline{A}, B)$ et $(\overline{A}, \overline{B})$ sont eux aussi indépendants.

Démonstration (cas (A, \overline{B}))

Supposons $A$ et $B$ indépendants. On veut $P (A \cap \overline{B}) = P (A) \cdot P (\overline{B})$ . Or $A = (A \cap B) \cup (A \cap \overline{B})$ (union disjointe), donc :

P (A) = P (A \cap B) + P (A \cap \overline{B}),

soit $P (A \cap \overline{B}) = P (A) - P (A \cap B) = P (A) - P (A) P (B) = P (A) (1 - P (B)) = P (A) \cdot P (\overline{B})$ . Les autres cas s'en déduisent par symétrie.

⚠ Piège #4 — Indépendance n'est PAS incompatibilité. Deux événements incompatibles ne sont presque jamais indépendants. En effet, si

A \cap B = \emptyset

alors

P (A \cap B) = 0

; l'indépendance demanderait

P (A) P (B) = 0

, donc

P (A) = 0

P (B) = 0

. Autrement dit, deux événements incompatibles et non négligeables ne peuvent jamais être indépendants. Intuition : si

A

B

s'excluent, savoir que

B

est arrivé t'apprend que

A

n'est pas arrivé — c'est l'opposé de l'indépendance.

💡 Contre-exemple Bernstein (indépendance 2 à 2 ≠ mutuelle). On lance deux pièces équilibrées indépendantes. Soit

A

= « 1^re pile »,

B

= « 2^e pile »,

C

= « les deux résultats sont identiques ». On a

P (A) = P (B) = P (C) = 1/2

. Calculs :

P (A \cap B) = 1/4 = P (A) P (B), P (A \cap C) = 1/4 = P (A) P (C), P (B \cap C) = 1/4 = P (B) P (C) .

Donc

(A, B, C)

est indépendante deux à deux. Mais :

P (A \cap B \cap C) = P (2 piles) = 1/4 \neq = P (A) P (B) P (C) = 1/8.

Donc la famille n'est pas mutuellement indépendante. À retenir absolument — c'est LE contre-exemple cité dans tous les jurys.

5. Erreurs classiques en copie (vues par les correcteurs)

Ces erreurs sont relevées chaque année dans les rapports de jury (CCINP, Mines-Ponts, Centrale, X-ENS) sur les épreuves comportant des probabilités conditionnelles. Elles coûtent typiquement entre 1 et 3 points par occurrence.

⚠ Erreur 1 — Confondre $P (A ∣ B)$ et $P (B ∣ A)$ . L'inversion des deux quantités est la faute n°1, particulièrement sur les exos type test diagnostic. Réflexe : avant d'écrire quoi que ce soit, traduis chaque probabilité en mots français (« sachant que

B

est réalisé, probabilité que

A

… »). Si l'énoncé donne la sensibilité d'un test, c'est

P (T ∣ M)

, pas

P (M ∣ T)

— et pour passer de l'un à l'autre, il faut Bayes.

⚠ Erreur 2 — Oublier de vérifier $P (B) > 0$ avant d'écrire $P_{B} (A)$ . Le conditionnement par un événement de probabilité nulle n'est pas défini. Dans toute démo ou application des formules (composées, totales, Bayes), tu dois écrire « comme $P (B_{i}) > 0$ , on a… ». Aux concours, l'absence de cette ligne coûte un demi-point systématique.

⚠ Erreur 3 — Appliquer les probabilités totales sans système complet. La formule

P (A) = \sum_{i} P (B_{i}) P_{B_{i}} (A)

suppose que

(B_{i})

est une partition de $Ω$ . Si tu écris

P (A) = P_{B} (A) + P_{\overline{B}} (A)

(sans pondération par

P (B)

P (\overline{B})

), c'est faux d'un facteur ; et si tu sommes sur des

B_{i}

qui ne couvrent pas

Ω

(oubli d'un cas) ou se chevauchent (

B_{i} \cap B_{j} \neq = \emptyset

), tu obtiens un résultat qui peut être strictement supérieur à 1. Vérifie toujours la partition.

⚠ Erreur 4 — Confondre indépendance 2 à 2 et indépendance mutuelle. Quand un énoncé pose « les

A_{i}

sont indépendants », il s'agit de l'indépendance mutuelle (toutes les sous-intersections vérifient le produit). Ne te contente pas de vérifier les couples

(A_{i}, A_{j})

: c'est plus faible (contre-exemple de Bernstein). Réciproquement, ne dis pas «

A

B

C

indépendants 2 à 2 donc mutuellement indépendants » — c'est la faute capitale.

⚠ Erreur 5 — Confondre indépendance et incompatibilité. Deux événements incompatibles

(A \cap B = \emptyset)

ne sont indépendants que si

P (A) = 0

P (B) = 0

(cas dégénéré). Écrire «

A

B

sont incompatibles donc indépendants » est une faute lourde — c'est exactement le contraire en général.

6. Pour aller plus loin

Les probabilités conditionnelles sont l'infrastructure de tout le programme de probabilités MPSI/MP. Les chapitres qui les réinvestissent directement :

Variables aléatoires discrètes — les lois conditionnelles $P (X = k ∣ Y = j)$ sont construites sur le même modèle que $P_{B} (A)$ . L'indépendance de variables aléatoires se définit via l'indépendance mutuelle des événements ${X_{i} \in A_{i}}$ .
Espérance conditionnelle (spé) — $E (X ∣ B)$ calcule la moyenne de $X$ sous la probabilité $P_{B}$ . La formule de l'espérance totale est l'analogue de la formule des probabilités totales pour l'espérance.
Chaînes de Markov (spé) — les transitions $P (X_{n + 1} = j ∣ X_{n} = i)$ sont précisément des probabilités conditionnelles, et la matrice de transition encode tout le système dynamique.
Statistique inférentielle — la formule de Bayes est l'outil central de l'inférence bayésienne, qui met à jour des distributions a priori à la lumière de données observées (et qui est partout en data science).

Récap final — Ce qu'il faut absolument retenir

À la veille d'une khôlle ou d'un DS, parcours cette checklist : tu dois pouvoir répondre « oui, sans hésiter » à chaque question.

Sais-tu écrire la définition de $P_{B} (A) = P (A \cap B) / P (B)$ (avec la condition $P (B) > 0$ ) sans regarder ?
Sais-tu démontrer que $P_{B}$ est une probabilité sur $Ω$ (vérification des trois axiomes) ?
Sais-tu énoncer et démontrer la formule des probabilités totales (système complet + additivité) ?
Sais-tu énoncer et démontrer la formule de Bayes à partir de la double écriture $P (A \cap B) = P (A) P_{A} (B) = P (B) P_{B} (A)$ ?
Sais-tu écrire la formule des probabilités composées généralisée pour $n$ événements ?
Sais-tu définir l'indépendance mutuelle d'une famille $(A_{i})$ (toutes les sous-intersections) ?
Sais-tu donner le contre-exemple de Bernstein (indépendance 2 à 2 ≠ mutuelle) ?
Sais-tu démontrer l'équivalence $P (A \cap B) = P (A) P (B) ⟺ P_{B} (A) = P (A)$ ?
Sais-tu construire et exploiter un arbre de probabilités (composées sur une branche, totales sur les branches sommées) ?
Sais-tu calculer la valeur prédictive positive d'un test diagnostic avec Bayes (et expliquer le résultat contre-intuitif) ?
Connais-tu les 5 erreurs classiques en copie et sais-tu les éviter (notamment $P (A ∣ B)$ vs $P (B ∣ A)$ , partition incomplète, indép. 2 à 2 vs mutuelle) ?

Démonstrations à savoir refaire

P_B est une probabilité sur Ω — vérification des trois axiomes (positivité, masse, additivité)
Formule des probabilités totales — partition par système complet + additivité finie
Formule de Bayes — double écriture des composées + dénominateur via probabilités totales
Équivalence indépendance ⇔ $P_{B} (A) = P (A)$ — division par $P (B) > 0$ , aller-retour direct

Vue d'ensemble

Prérequis

1. Définitions essentielles

2. Théorèmes fondamentaux

2.1 — P_B est une probabilité sur Ω

2.2 — Formule des probabilités composées

2.3 — Formule des probabilités totales

2.4 — Formule de Bayes

3. Arbres de probabilités — méthode visuelle

4. Indépendance — caractérisations et subtilités

5. Erreurs classiques en copie (vues par les correcteurs)

6. Pour aller plus loin

Récap final — Ce qu'il faut absolument retenir

Démonstrations à savoir refaire

Fiches associées

Nombres réels

Suites numériques

Généralités sur les fonctions

Limites et continuité

Fonctions dérivables

Logarithmes, exponentielles et puissances

Tu veux aller plus loin sur ce chapitre ?