Commençons par définir les choses

Comment définir la notion de probabilité ?

La notion de probabilité est familière et si chacun a une notion souvent vague et personnelle de la probabilité, globalement tout le monde semble comprendre à peu près la même chose sous le terme de probabilité. En général, la probabilité est considérée ou définie comme une mesure de la chance qu’un évènement survienne. Ce qui est pour le moins une définition circulaire. Si tout le monde s’en satisfait le plus souvent, cette notion est pourtant plus subtile qu’il n’y parait et il est fondamental de disposer d’une bonne définition de la probabilité lorsque l’on souhaite s’en servir, notamment dans le domaine médical.

Sans faire une revue historique de cette notion, on peut noter que les Grecs anciens étaient passé totalement à côté de la notion de probabilité. Celle-ci n’était pas conceptualisée dans leur société encore emprunte de déisme et donc d’explications déterministes surnaturelles dans lesquelles le hasard n’avait pas sa place. Si la notion de possible est reconnue, la notion de probable ne l’était pas au-delà de son application dans les jeux de hasard. Mais sa conceptualisation était absente des discours et de la pensée des philosophes grecs.

En sautant quelques siècles (je ne suis pas historien ! Les amateurs d’Histoire des sciences pourront consulter avec profit l’ouvrage de référence de Ian Hacking, « L’Emergence de la Probabilité »), on arrive au siècle des Lumières, avec Pascal et Descartes et le Chevalier de Méré.

Première définition de la probabilité

La probabilité d’un évènement E d’intérêt a longtemps été définie comme le rapport de deux nombres, ou plus exactement de deux dénombrements : le nombre A de situations dans lesquelles l’évènement E survient et le nombre B de situations dans lesquelles l’évènement E peut survenir. Le rapport A/B constitue une définition de la probabilité de l’évènement E. Si l’on parle de dénombrement, c’est que les évènements considérés sont dénombrables : on peut, souvent par la simple logique, en établir une liste exhaustive. On peut donc les compter individuellement et les additionner.

Pr(E) = # E se réalise / # cas possibles

Cette définition est celle classiquement utilisée au lycée et dans les cours d’initiation aux probabilités. Elle est la base de nombreux exercices visant à calculer, par exemple, la probabilité de tirer un 2 ou un 3 lors du lancer d’un dé supposé équilibré ou bien d’obtenir 3 reines en tirant 5 cartes au hasard dans un jeu de 32 cartes.

Cette définition, outre d’être simple, présente l’avantage d’être applicable à un évènement unique. Si on lance le dé une seule fois, on peut, via cette définition, calculer la probabilité de tirer un 5, par exemple.

Mais cette définition est moins simple et moins intuitive qu’il n’y parait. Pourquoi ?

Elle semble pourtant pouvoir s’appliquer à beaucoup de situations quotidiennes : quand je vais acheter une baguette chez le boulanger du coin, 9 fois sur 10, il a fallu que je fasse la queue à l’extérieur de la boulangerie. Donc, j’ai une probabilité de 0,9 que cela m’arrive aujourd’hui. En effet, on a l’impression de pouvoir dénombrer les cas possibles (aller à la boulangerie) ainsi que les cas où l’évènement d’intérêt (faire la queue si on admet qu’il puisse y avoir un intérêt à faire la queue…) survient.

Cette définition présente pourtant deux limites.

Il y a beaucoup de situations où l’on peut facilement identifier dans quelles circonstances l’évènement d’intérêt peut survenir et les situations ou l’évènement d’intérêt survient sans que l’on puisse calculer directement le rapport de l’un sur l’autre. L’exemple de la boulangerie en est une et en voici une seconde. Si par exemple vous lancez une punaise sur votre bureau, celle-ci va tomber soit sur la « tête » (ou T) soit en étant penchée, appuyée sur la pointe et la tranche (on parlera alors ici de « pointe », P, pour simplifier).

Les cas possibles (tête et pointe) et l’évènement d’intérêt (pointe par exemple) sont aisément identifiés avant même de lancer la punaise. Mais pour ce qui est d’être dénombrable c’est moins simple qu’il n’y parait. Je défie quiconque de me donner immédiatement la valeur de la probabilité d’obtenir « pointe » quand je lance une telle punaise sur mon bureau. Ce rapport n’est évidemment pas égal à ½. Mais en probabilité, comme dans tout domaine de la mathématique, tous les mots d’une définition ont leur importance. Dans cet exemple, la probabilité recherchée n’est de toute évidence pas simplement le rapport « cas favorable sur cas possibles ». La simple énonciation des situations ne suffit pas : il faut vraiment pouvoir les énumérer, les dénombrer, ce qui apporte comme contrainte supplémentaire de pouvoir les compter et pas seulement les énoncer. Un problème similaire se pose lorsque l’on veut connaître la probabilité d’avoir la grippe durant le prochain hiver ou de subir une rupture des ligaments croisés au cours d’une après-midi de ski. Lorsque l’on ne peut plus s’appuyer sur des arguments basés sur des lois physiques évidentes, il faut disposer d’une série d’observations pour savoir quel est le nombre de fois où l’on obtient « pointe » et le nombre de fois où l’on obtient « tête ». Il faut en plus pouvoir dénombrer le nombre de fois où chaque situation survient. C’est le dénombrement des situations qui fera la probabilité et pas le seul énoncé des situations. C’est là que l’on voit la deuxième limite inhérente à la première définition donnée plus haut : elle présuppose que les cas possibles sont équiprobables pour que le dénombrement puisse se faire par simple énonciation. Pour pouvoir assimiler le rapport « cas d’intérêt sur cas possible » à la probabilité, soit il faut considérer que les cas possibles sont équiprobables, et alors le rapport est simple à calculer, soit il faut obtenir une valeur de la fréquence d’apparition des cas possibles et alors recourir à l’observation.

Pour que l’on puisse assimiler 1/6 à la probabilité d’avoir un 5 sur un lancer, il faut donc que l’on puisse admettre que quel que soit le nombre de lancers que l’on fera, le rapport du nombre d’évènement d’intérêt sur le nombre d’évènement possible pourra se ramener à la fraction 1/6. Cela suppose que les cas soient équiprobables.

Cela implique que la définition classique de la probabilité est circulaire. En effet, pouvoir dire que la probabilité d’avoir un 5 lors du lancer unique d’un dé vaut 1/6, suppose que le dé soit équilibré, ce qui revient à dire que chaque face a a priori la même probabilité de sortir. Si on peut faire cette hypothèse à partir d’arguments de symétrie et des lois de la physique, cela implique tout de même d’avoir déjà défini la notion de probabilité pour pouvoir identifier à partir du modèle physique que chaque face est équiprobable. Bref, il faut avoir défini la probabilité pour la définir. Comment s’en sortir ? Une première solution sera exposée dans un article ultérieur. Mais en attendant, on peut tout de même clarifier l’utilisation de cette définition de la probabilité : lorsque l’on utilise cette définition, il s’agit d’une définition pragmatique mais elle ne peut pas en soit définir ce qu’est une probabilité. Il s’agit plutôt d’une recette, une manière de calculer la probabilité d’un évènement lorsque l’on est dans une situation particulière dans laquelle on pourra considérer que la notion de probabilité aura déjà été définie et que certaines hypothèses physiques ou logiques peuvent être formulées. En modifiant légèrement une des phrases précédentes, on pourrait dire qu’il faut avoir défini la probabilité pour pouvoir la calculer, et encore, seulement dans un certain type de situations. Il reste à voir comment calculer la probabilité d’avoir la grippe, ou que la punaise tombe sur la pointe.

Cela a l’air de rien, ou l’air d’être du pinaillage, mais cela a des conséquences profondes sur l’utilisation que l’on peut faire des probabilités dans le domaine scientifique et sur la manière actuelle de faire de la science dans le domaine médical notamment.

En résumé : la définition classique de la probabilité spécifie que la probabilité d’observer l’évènement E est le rapport du nombre de cas où l’on observe effectivement E sur le nombre de cas où l’évènement peut être observé. Mais cela impose que les situations dans lesquelles l’évènement peut être observé soient équiprobables. Dans le cas contraire, on ne peut pas calculer la probabilité, du moins pas de cette manière. Cette définition est donc circulaire si on souhaite l’utiliser pour définir la notion de probabilité, et elle ne peut être appliquée que si l’on sait déjà ce qu’est la notion de probabilité et que l’on peut être sûr dans une situation donnée que les évènements sont tous équiprobables, ce qui est rarissime en pratique.

Laisser un commentaire