Efficacité vaccin du sida

Jeudi 24 septembre 2009, des chercheurs américains et thaïlandais ont annoncé avoir mis au point un vaccin permettant de réduire de 31,2 % les infections au virus du sida. Cette information a circulé tout autour de la terre comme un formidable message d’espoir… Dans l’article que j’ai lu, ils parlaient d’une expérience effectuée sur 16000 individus… qui ont été divisés en deux groupes, l’un ayant le vaccin et le second un placebo. Cependant, aucune autre information n’était disponible : combien de cas de sida dans chaque groupe, comment ont été constitués les groupes, quels étaient les risques de contamination des individus, et un certain nombre d’informations importantes… Et surtout : comment ce nombre de 31,2% a-t-il été calculé ?

Ne disposant pas de ces résultats et voulant mettre en garde les étudiants de médecine auxquels je donnais des cours cette année, je leur ai fait tester l’hypothèse : « le vaccin n’a aucun effet » sur un échantillon de 16000 personnes, 6000 ayant reçu le vaccin et 10000 un placebo; avec une prévalence (très élevée) de 1% dans la population. Ainsi, sur le groupe de 10 000 individus, 100 présentaient le virus, et 42 parmi le groupe ayant été vacciné, ce qui – ramené à effectif comparable – est une baisse de 30% du virus du sida. Après de petits calculs, on ne peut pas rejeter l’hypothèse faite au risque 5%… c’est-à-dire qu’il est possible que les différences d’effectifs soient le seul fait du hasard (mais pas forcément que le vaccin n’a eu aucun effet) à 95% ! Conclusion : impossible d’en dire plus…

Aujourd’hui, je suis tombé sur une brève de l’AFP, expliquant un peu mieux comment ont été formés les groupes, etc. En refaisant une comparaison de pourcentage à l’aide du test du \chi^2, on obtient au risque 5% le rejet de l’hypothèse, c’est-à-dire qu’avec un risque de 5% de se tromper, on peut dire que le vaccin a eu un effet ! Bon, après, il faut relativiser : le chiffre avancé de 31,2% est assez… arbitraire ! Rien ne dit que le vaccin provoque une immunité dans 30% des cas : ce chiffre est fortement contesté par la communauté scientifique. De plus, ce sont deux groupes de volontaires, donc ce n’est pas un essai thérapeutique randomisé, on ne sait pas s’il s’agit d’un test en double aveugle (c’est-à-dire médecins et patients ignorent s’ils ont le vaccin ou un placebo) ou si seul le patient ignore le produit qui lui a été injecté. On ne sait rien des effets à long terme, et on ne sait pas si ce vaccin serait utilisable en Afrique (population à haut risque, avec un type différent de virus) !

Bref, une modeste avancée, mais qui s’avère statistiquement significative au risque 5%… Mais on est loin des 31,2% de protection annoncés !

Le matraquage médiatique et les pourcentages lancés sans aucune explication permettent une manipulation importante d’une population non prévenue… Il existe de nombreux exemples de cette manipulation :

- Suite au premier tour de l’élection présidentielle française en 2002 (et la surprise pour une grande partie des français des résultats du front national), le canard enchaîné (hebdomadaire satirique) avait publié une image mettant en avant la corrélation entre les retombées radioactives de Tchernobyl et les résultats du Front National dans les départements

Corrélation entre retombées radioactives de Tchernobyl et vote en faveur du Front National

Corrélation entre les retombées radioactives de Tchernobyl et le vote en faveur du Front National

Mais ce qu’il faut savoir, c’est qu’une corrélation entre deux phénomènes de ce genre, en mathématiques, indique une relation du genre :

si on est dans une région ayant eu de fortes retombées suite à la catastrophe de Tchernobyl, alors le vote Front National est élevé dans notre région, et inversement

En effet, si notre département a beaucoup voté FN, on doit être dans l’est et du coup, il y a de grandes chances que les retombées du nuage radioactif aient été importantes. Mais il n’y a pas forcément dépendance entre les événements, c’est-à-dire que ça ne signifie pas qu’un des éléments a causé le second !

- Quand la sécurité routière annonce des pourcentages, elle dit qu’il y a par exemple 97% des accidents sur des lignes droites le jour et 3% la nuit, et donc qu’il faut être prudent le jour aussi, etc. Ce qu’elle ne mentionne pas, c’est qu’il y a beaucoup plus de circulation le jour que la nuit, et que proportionnellement, la probabilité d’avoir un accident sur une ligne droite le jour est très faible, alors que cette probabilité est beaucoup plus importante de nuit !

Les nombres permettent de manipuler les individus, il convient de rester vigilant et critique envers tous ces pourcentages qui jonchent l’actualité !

Entiers et probabilité

Voilà un résultat fort intéressant :

Soient a et b deux entiers naturels non nuls inférieurs à n!. En notant p_n la probabilité que a et b soient premiers entre eux, on a

\lim_{n \to +\infty} p_n= \frac{6}{\pi^2} \approx 61\%.

C’est-à-dire que la « probabilité » que deux entiers soient premiers entre eux est de 6/\pi^2. Mais il faut faire attention avec ce mot, comme nous le verrons plus bas !

On rappelle que n!=1\times 2\times 3 \times \cdots \times n.

La fonction zêta de Riemann

Une fonction très connue en théorie des nombres est la fonction zêta de Riemann, notée \zeta. Sur les entiers supérieurs ou égaux à 2, elle est définie par :

\zeta(n)=1+\frac{1}{2^n}+\frac{1}{3^n}+\cdots=\sum_{k=1}^{+ \infty} \frac{1}{k^n}.

Ce qui est remarquable, c’est qu’elle est fortement reliée aux nombres premiers à travers la formule suivante :

\zeta(n)=\left( \frac{1}{1-1/2^n}\right)\left( \frac{1}{1-1/3^n}\right)\left( \frac{1}{1-1/5^n}\right)\cdots=\prod_{p \in \mathbb P} \frac{1}{1-1/p^n}

où l’on fait le produit sur tous les nombres premiers.

Un autre fait remarquable, c’est que la valeur de \zeta(2) est connue :

\zeta(2)=\sum_{k=1}^{+\infty} \frac{1}{k^2}=\frac{\pi^2}{6}.

Pour des démonstrations de ces résultats, on pourra se reporter aux articles produit eulérien et problème de Bâle sur Wikipédia.

Pourquoi ce « n! » ?

On peut se demander pourquoi on demande que les deux entiers a et b soient bornés par n! Tout simplement parce qu’il n’existe pas de mesure de probabilité uniforme sur l’ensemble \mathbb N des entiers naturels, ce qui empêche de parler de probabilité sur les entiers directement. Une loi uniforme est la seule qui modélise correctement le fait de prendre des objets au hasard, car elle associe la même probabilité à chaque élément.

Plus formellement, si on disposait d’une mesure de probabilités uniforme \mu sur \mathbb N, alors on aurait d’une part \mu(\mathbb N)=1, mais aussi \mu(\{n\})=\varepsilon pour tout n. Or c’est impossible, car on a

1=\mu(\mathbb N)=\mu\left( \bigcup_{n \in \mathbb N} \{n\} \right)=\sum_{n =0}^{+\infty} \mu(\{n\})=\sum_{n =0}^{+\infty} \varepsilon.

Si \varepsilon=0, on aurait 1=0 et si \varepsilon>0 on aurait 1=+\infty, absurde.

Il est donc incorrect de parler de probabilité que deux entiers soient premiers entre eux. Le résultat énoncé plus haut n’en reste pas moins intéressant.

Démonstration

Soit p un nombre premier inférieur à n. Notons A_p l’évènement p n’est pas un diviseur commun de a et b.

La probabilité pour que a soit divisible par p est de 1/p. En effet, le nombre k de multiples de p dans \{1,\ldots,n!\} vérifie

n!-p < kp\leq n!

c’est-à-dire

\frac{n!}{p}-1 < k \leq \frac{n!}{p}.

Or n! est divisible par p, donc n!/p est un entier. Le nombre k étant lui-même un entier, on a nécessairement k=n!/p.

La proportion (et donc la probabilité que a soit divisible par p) d’entiers divisibles dans \{1,\ldots,n!\} est donc de

\frac{k}{n!}=\frac{n!/p}{n!}=\frac{1}{p}.

On refait le même raisonnement pour b. Par indépendance sur les choix de a et b, la probabilité que a et b soient tous les deux divisibles par p est de 1/p^2. La probabilité de l’événement A_p est donc de 1-1/p^2.

L’événement B_n : « a et b sont premiers entre eux » est se produit quand ils n’ont pas de facteurs commun, c’est-à-dire quand les événements A_i sont tous réalisés en même temps. On a donc

p_n=P(B_n)=P\left( \bigcap_{p \leq n!} A_p\right)

et par indépendance

p_n=\prod_{p \leq n!}  P(A_p)=\prod_{p \leq n!} \left(1-\frac{1}{p^2}\right)

d’où en passant à la limite sur n :

\lim_{n \to +\infty} p_n = \frac{1}{\zeta(2)}=\frac{6}{\pi^2}

ce qui achève la démonstration.

Pour aller plus loin

On peut raffiner le théorème en travaillant avec n plutôt qu’avec n! mais la démonstration est plus difficile.