Archive

Archives de l'auteur

Partage de secret

Supposons que le PDG d’une grande compagnie de soda veuille garder secrète la recette qui a fait la fortune de l’entreprise. Il l’enferme donc dans un coffre fort blindé, qui s’ouvre à l’aide d’une certaine clé (qu’il garde secrète). Cette solution est très sécuritaire dans le sens où seul le PDG peut accéder au secret. Mais elle revêt un gros défaut : si le PDG perd cette clé, ou vient à décéder dans un accident, la clé est perdue et personne ne peut jamais accéder à la recette, entraînant inévitablement la déroute de la multinationale.

Une des solutions est de donner des copies de cette clé secrète à des collaborateurs au travail. Mais répliquer la clé augmente les chances des espions de l’obtenir et de rapporter la recette à l’entreprise concurrente. Le PDG est bien conscient qu’il ne peut pas faire entièrement confiance à un de ses 5 subordonnés. Il veut donc mettre en place un schéma où tout groupe contenant au moins 3 de ses subordonnés puisse ouvrir le coffre alors que tout groupe contenant strictement moins de 3 subordonnés ne puisse rien savoir sur la clé.
Une solution qui consisterait à donner des bouts du secret aux subordonnés de manière à ce qu’ensemble ils puissent le reconstruire ne convient pas parce qu’ils connaîtraient alors partiellement la clé secrète.

Ce problème peut-être résolu par la mise en place d’un schéma de partage de secret.

Le partage de secret avec seuil

Notons 2\leq t<n des entiers. Notre but est de partager une clé secrète K entre un ensemble de n personnes \mathcal P = \{P_1, \ldots, P_n\} de telle manière que toute coalition de t ou plus de ces personnes puisse calculer K facilement, et que toute coalition de t-1 ou moins de ces personnes ne puisse rien déterminer sur la valeur de K, autrement dit que toutes les valeurs de K possibles soient équiprobables. Un tel schéma est appelé un schéma au seuil (t,n). Dans l’exemple introductif, le PDG cherche un schéma au seuil (3,5).

La valeur du secret est choisie par un participant spécial D (le dealer) (que l’on suppose bien évidemment ne pas faire partie de \mathcal P). Le dealer va donner à chaque participant une clé de partage. Cette distribution sera secrète bien entendu, pour qu’aucun des participants ne connaissent les clés de partage des autres participants.

Le problème de construire un tel schéma a été résolu indépendamment par Sharmir [1] et Blakley [2] en 1979.

Schéma de Shamir

Commençons par présenter le schéma de Shamir, qui repose sur l’interpolation polynômiale.

Le dealer veut partager la clé secrète K\in \mathbf F_qq\geq n+1 est la puissance d’un nombre premier (on peut prendre q=p premier et raisonner dans \mathbf F_p bien évidemment). Il choisit de manière aléatoire n éléments distincts de \mathbf F_q que l’on note x_1, \ldots, x_n. Ces éléemnts ne sont pas les clés de partages secrètes, ce sont des clés publiques : chaque P_i reçoit la clé x_i. Dans l’exemple du PDG, on pourrait dire par exemple que x_i représente l’ordre d’arrivée de l’employé dans l’entreprise. Ensuite, il réalise les étapes suivantes :

  1. Il choisit secrètement et aléatoirement t-1 éléments de \mathbf F_q notés a_1, \ldots, a_{t-1}.
  2. Pour tout 1\leq i\leq n, le dealer calcule y_i=a(x_i)

    a(X) = K+\sum_{i=1}^{t-1}a_jX^j.

  3. Pour tout 1\leq i\leq n, le dealer donne secrètement la clé de partage y_i à P_i

Regardons comment un groupe B=\left\{P_{i_1}, \ldots, P_{i_t}\right\} de t personnes (avec leur clé publique x_i) peut retrouver les coefficients secrets du polynôme a(X) par interpolation, et ainsi retrouver K=a(0). Comme y_{i_k} = a(x_{i_k}) pour tout 0\leq k\leq t, le groupe B obtient t équations linéaires en les t inconnues K, a_1, \ldots, a_{t-1}. Ainsi, le système obtenu par B peut-être écrit sous la forme

\begin{pmatrix}1& x_{i_1}& x_{i_1}^2& \cdots& x_{i_1}^{t-1}\\1& x_{i_2}& x_{i_2}^2& \cdots& x_{i_2}^{t-1}\\\vdots& \vdots & \vdots & & \vdots\\1& x_{i_t}& x_{i_t}^2& \cdots& x_{i_t}^{t-1}\\\end{pmatrix}\begin{pmatrix}K\\a_1\\\vdots\\a_{t-1}\end{pmatrix} = \begin{pmatrix}y_{i_1}\\y_{i_2}\\\vdots\\y_{i_t}\end{pmatrix}.

Or, la matrice A des coefficients x_i est appelée matrice de Vandermonde et son déterminant vaut \det(A) = \prod_{1\leq k<j\leq t}\left(x_{i_j}-x_{i_k}\right)\neq 0. Comme il est non nul (par choix des x_i), le système admet une unique solution sur \mathbf F_q, et K peut-être retrouvé.

Supposons maintenant que t-1 des n clés de partages secrètes sont révélées à un ennemi. Pour chaque candidat K'\in \mathbf F_q pour le secret, l'ennemi peut construire un et un unique polynôme a'(X) de degré t-1 tel que a'(0)=K' et a'(x_i)=y_i pour les t-1 clés connues. Par construction, ces q possibles polynômes sont équiprobables, en conséquence de quoi l'espion ne peut rien déduire sur la valeur de la clé secrète K.

Bien entendu, il y a une méthode alternative basée sur la formule de l'interpolation de Lagrange. La formule est la suivante :

a(X) = \sum_{j=1}^t y_{i_j} \prod_{\substack{1\leq k\leq t\\k\neq j}}\frac{X-x_{i_k}}{x_{i_j}-x_{i_k}}.

Étant donné qu’un groupe recherche la valeur du secret K=a(0), ils peuvent calculer

K = \sum_{j=1}^{t}y_{i_j}b_j, \qquad \text{avec} \quad b_j = \prod_{\substack{1\leq k\leq t\\k\neq j}}\frac{x_{i_k}}{x_{i_k}-x_{i_j}}.

Remarquons que les valeurs b_j ne dépendent que des x_i et peuvent-être pré-calculées.

Un exemple concret

Donnons un petit exemple concret pour soulager notre PDG qui a vraiment peur de faire un infarctus qui perdrait à tout jamais la recette ! Supposons que q=17 et que les coordonnées publiques sont x_i = i pour tout 1\leq i\leq 5. Supposons maintenant que les collaborateurs P_1, P_3 et P_5 veuillent retrouver le secret. Ils mettent en commun leurs clés de partages secrètes qui sont respectivement 8, 10 et 11. Comme a(X) = K+a_1X+a_2X^2, ils obtiennent le système d’équation suivant :

\left\{\begin{array}{lll}K+a_1+a_2 &=&8\\K+3a_1+9a_2&=&10\\K+5a_1+8a_2&=&11\end{array}\right.

Ce système admet une unique solution dans \mathbf F_{17}=\mathbf Z/17\mathbf Z : K=13, a_1=10 et a_2=2. Le secret est donc K=13 !

Schéma de Blakley

Donnons un autre exemple : le schéma de Blakley basé sur la géométrie des hyperplans sur les corps finis. Le secret est un point d’un espace t-dimensionnel, et les n clés de partages secrètes sont des hyperplans affines passant par ce point. Un hyperplan dans un espace t-dimensionnel à coordonnées dans un corps \mathbf F peut être décrit par une équation de la forme suivante :

a_1x_1 + a_2x_2 + \cdots + a_tx_t = y.

Le point d’intersection est obtenu en trouvant l’intersection d’un ensemble quelconque de t de ces hyperplans. Par exemple, le secret peut être la première coordonnée du point d’intersection.

Disons que \mathbf F = \mathbf F_q est le corps sur lequel on travaille. Le dealer génère un point x dans \mathbf F_q^t, où la première coordonnée x_1 est la clé secrète et les autres coordonnées sont choisies aléatoirement dans \mathbf F_q. Le ième participant recevra comme clé de partage secrète l’hyperplan sur \mathbf F_q d’équation

a_{i,1}x_1+a_{i,2}x_2+\cdots+a_{i,t}x_t=y_i.

Pour obtenir un schéma au seuil (t, n), il y aura n équations d’hyperplan, et on obtient alors un système linéaire n\times t: Ax=y.

Le dealer donne en pratique la clé de partage secrète y_i ainsi que les coordonnées (qui peuvent être publiques) a_{i,1}, \ldots, a_{i,t} au participant P_i. un choix judicieux pour la matrice A est de faire en sorte que ses lignes soient les lignes d’une matrice de Vandermonde pour se ramener à une situation similaire à celle du schéma de Shamir.

Pour aller plus loin…

Bien entendu, ceci n’est qu’une introduction sommaire à un domaine toujours en pleine expansion en cryptologie. On pourra trouver d’autres schémas basés sur la géométrie, sur les graphes, sur le théorème des restes chinois… Une excellente introduction au sujet est l’article [3].

Pour les plus intrépides d’entre vous, remarquez que jusquà présent nous avons travaillé sur des corps, s’autorisant allégrement la possibilité d’inverser pour retrouver le secret si nécessaire. Un sujet intéressant est de vouloir construire des schémas valables sur n’importe quel groupe abélien (sans connaître le groupe, c’est-à-dire un schéma en boîte noire), qui ont fait l’objet de deux articles récents [4] et [5].

Références
  • [1] A. Shamir – « How to share a secret », Communications of the ACM 22 (1979), no. 11, p. 612 – 613.
  • [2] G. R. Blakley – « Safeguarding cryptographic keys », AFIPS Conference Proceedings 48 (1979), p. 313 – 317.
  • [3] D. R. Stinson – « An explication of secret sharing schemes », Designs, Codes and Cryptography 2 (1992), no. 4, p. 357 – 390.
  • [4] R. Cramer & S. Fehr – « Optimal black-box secret sharing over arbitrary Abelian groups », Advances in Cryptology – CRYPTO’02 (2002), p. 272 – 287.
  • [5] R. Cramer, S. Fehr & M. Stam – « Black-box secret sharing from primitive sets in algebraic number fields », Advances in Cryptology – CRYPTO 2005, Springer, 2005, p. 344-360.

Rapporteurs de Golomb et algorithmes génétiques

25/05/2010 Tukikun un commentaire

Dans le cadre du T.I.P.E de seconde année de classe préparatoire aux Grandes Écoles, j’ai travaillé sur la recherche de rapporteurs de Golomb via les algorithmes génétiques ; une idée originale développée par André Narbonne sur son site internet (apparemment plus disponible).

Les algorithmes génétiques font parti de la famille des algorithmes évolutifs, et s’inspirent de l’évolution biologique telle que décrite par Darwin. Leur principale utilisation est la résolution de problèmes concrets d’optimisation, trop complexes pour être résolus de façon exhaustive, tel le problème du voyageur de commerce, où l’on cherche le meilleur itinéraire (c’est-à-dire le plus court) pour relier un nombre fini de villes.

Dans cet article, nous étudierons la possibilité d’appliquer les algorithmes génétiques pour découvrir des rapporteurs de Golomb.

Qu’est qu’un rapporteur de Golomb ?

Le mathématicien Solomon W. Golomb présenta en premier lieu « la règle de Golomb » qui est une règle mesurant plus de longueurs (discrètes) que le nombre de marques qu’elle contient. De plus, la même distance n’est pas mesurée deux fois.

Un exemple simple de cette règle est celle constituée des marques 0; 1; 4; 6 qui permet de mesurer les longueurs 1; 2; 3; 4; 5 et 6 une et une seule fois entre deux marques de la règle.

C’est en partant de cet exemple simple que la question s’est posée pour les rapporteurs : est-il possible de faire un rapporteur avec le moins de marque possible qui mesure les angles de 1 à 360 degrés ? Un rapide calcul montre que la limite minimale théorique est de 20 marques : en effet, avec n marques, on peut mesurer n(n-1) angles. Pour 19 marques, on mesure ainsi au plus 342 angles, et au plus 380 pour 20 marques.

La solution de l’algorithme génétique semble adaptée à ce problème. En effet, si pour 20 marques, l’on voulait tester toutes les possibilités, afin de trouver celle qui permet la mesure de 180 angles (si tant est que ce soit possible), avec les marques 0 et 1 fixées (une simple rotation nous y ramène), il faudrait près de 10^{45} opérations pour construire les rapporteurs, et d’avantage encore (10^{90}) pour compter le nombre d’angles qu’ils mesurent.

Plan de l’algorithme

Génération : L’algorithme génétique présenté sur l’organigramme débute avec une génération de N rapporteurs (entre une centaine et quelques milliers par exemple), c’est-à-dire des tableaux de taille n (nombre de marques désiré), contenant des angles compris entre 0 et 359, triés par ordre croissant. Le tri de ces tableaux est une opération relativement coûteuse (utilisation du tri rapide), mais il n’est effectué qu’une fois au début de l’algorithme.

On calcule ensuite pour chaque rapporteur le nombre d’angles qu’il mesure, sachant que l’on cherche à en obtenir un mesurant tous les angles de 1 à 360 degrés.

Puis on répète le processus suivant un nombre fini de fois : (c’est-à-dire de générations)

  • Calculs de la moyenne, du minimum, et du maximum d’angles mesurés, ce qui servira pour la sélection, et pour observer l’évolution de la population.
  • Évaluation : On attribue à chaque rapporteur une probabilité de survie, dépendant du nombre d’angles qu’il mesure. Plus un rapporteur mesurera d’angles, plus il aura de chance de survivre. Les différentes fonctions d’évaluation seront décrites et comparées plus loin.
  • Sélection : Si un rapporteur « survit », on le conserve pour la génération suivante. Sinon, on choisit au hasard deux parents, que l’on croise (Croisement) pour obtenir un « enfant », dont on compte les angles.

On obtient ainsi une nouvelle génération de même taille, sur laquelle on effectue éventuellement des mutations, avant de recommencer le processus.

Evaluation

Différents types de fonctions d’évaluation ont été étudiés afin d’obtenir une vitesse de convergence optimale, ainsi qu’un échantillonnage optimal. Le but étant de sélectionner les meilleurs individus, tout en
laissant une part de « moins bons » individus pour conserver une certaine diversité et variabilité. On évite ainsi la convergence rapide vers un individu optimal localement mais non solution au problème.

Rang Affine

Le type affine fait correspondre à chaque individu une probabilité de survie qui est fonction affine du nombre d’angle m qu’il mesure, c’est-à-dire de la forme am + b, où a et b sont à déterminer arbitrairement.

Cependant les meilleurs résultats ont été obtenus en utilisant des coefficients variables dépendant des variables moyenne, minimum et maximum du nombre d’angles mesurés.

Le type exponentiel fait correspondre à chaque individu une probabilité de survie qui est fonction exponentielle du nombre d’angle m qu’il mesure, c’est-à-dire de la forme e^{am +b}, où a et b sont à déterminer arbitrairement. En agissant sur les coefficients, on peut accentuer ou diminuer la courbure selon la méthode de sélection voulue.

Rang Exponentiel

Une autre méthode, qui a produit de meilleurs résultats, est d’attribuer à chaque individu son rang (fonction du nombre d’angles mesurés), et de se servir de celui-ci plutôt que du nombre d’angles mesurés pour l’évaluation. Un tri par dénombrement a été utilisé pour déterminer le rang de chaque individu. L’évaluation peut ici aussi être fonction affine ou exponentielle du rang. Une comparaison entre ces deux méthodes sur 500 générations (statistiques sur plusieurs populations) révèle une convergence plus rapide et pas moins optimale pour la méthode affine.

Sélection

Deux méthodes ont été envisagées : soit construire la nouvelle génération uniquement à partir d’ « enfants » obtenus par croisement (cf. partie Croisement) de 2 parents, soit remplacer uniquement les parents non sélectionnés, et conserver ceux qui ont « survécu ». C’est cette dernière méthode qui a été retenue.

L’algorithme initial ne gardait pas les meilleurs individus, ce qui a été résolu par la suite. C’est ce que l’on appelle la méthode élitiste, qui a montré ses preuves dans beaucoup d’études faites sur les algorithmes génétiques, y compris sur cet exemple.

Croisement

Le premier croisement étudié était un croisement très simple : les tableaux de chaque parent étaient parcourus simultanément et, une des deux valeurs choisie aléatoirement (sauf si elle a déjà été choisie)
constituait la nouvelle valeur pour l’enfant créé. Cependant, cette méthode ne conservait pas la structure des parents, et était de ce fait trop aléatoire.

Le second croisement fut un croisement à 1 point : l’ordinateur choisissait un angle au hasard et découpait les parents pour fabriquer deux enfants, l’enfant 1 ayant la première moitié du parent 1 et la seconde du parent 2, et inversement pour l’enfant 2. A la vue de divers ouvrages sur les algorithmes génétiques, il nous est apparu que le croisement à deux points était plus avantageux (même principe qu’à un point mais avec un découpage en trois parties). En effet, il permet plus de combinaisons possibles à partir de mêmes parents, et ainsi permet une plus grande variabilité des individus. Ce fut donc le troisième et dernier croisement testé, et celui gardé pour l’algorithme final. Le choix entre les deux enfants est aléatoire, afin de ne pas nuire à la diversité en choisissant systématiquement le meilleur enfant.

Mutation

Là également diverses méthodes ont été essayées, mais elles n’ont pas donné de résultats significativement différents. Le principe est le même à chaque fois : on parcourt la population, on génère un nombre décimal aléatoirement entre 0 et 100, et s’il est inférieur à un coefficient de mutation défini au début de l’algorithme, on mute l’individu. La première mutation essayée était la modification d’un angle choisi au hasard en lui rajoutant plus ou moins 1. La seconde était le remplacement d’un angle au hasard par un nouvel angle choisi aléatoirement entre le précédent et le suivant.

La troisième mutation testée, et celle qui a été conservée, permet de jouer sur chaque angle de chaque individu, définissant le coefficient de mutation non plus pour un individu mais pour chaque angle. Ceci complique l’algorithme, mais a permis d’avantage de résultats pour 25 marques.

De la même façon pour le croisement, il est possible d’utiliser une méthode élitiste, c’est-à-dire de conserver l’individu obtenu après mutation seulement s’il est meilleur que l’original.
Celle-ci semble diminuer encore une fois la diversité, mais la comparaison ci-contre permet tout de même de valider celle-ci, et de décider du meilleur coefficient de mutation à choisir.
Un minimum de mutation est nécessaire pour améliorer et diversifier les individus. Mais s’il est trop élevé, chaque individu a une trop grande probabilité d’être muté, et de ce fait les résultats deviennent trop aléatoires.

Autre piste intéressante

Comme suggéré par André Nabonne, sur le site Internet sur lequel il a effectué un travail semblable, il est possible de rechercher les meilleurs éléments pour un nombre de marques moins important et le compléter ensuite pour obtenir un rapporteur qui mesure 360 angles avec 1 à 2 marques supplémentaires. Cependant ce n’est pas la méthode qu’il lui a permis de battre le record précédemment détenu par J. Cottereau avec 24 marques, en obtenant des rapporteurs de 23, et même de 22 marques.

Oui c’est joli le blabla… Mais on peut voir un vrai rapporteur de Golomb ?

– Pour 27 marques : 0, 8, 14, 40, 41, 42, 45, 58, 75, 99, 146, 151, 153, 175, 179, 180, 193, 218, 241, 276, 285, 300, 321, 323, 331, 348, 349
– Pour 26 marques : 0, 5, 49, 51, 65, 91, 92, 97, 107, 115, 136, 144, 148, 176, 180, 198, 200, 207, 210, 211, 219, 270, 287, 305, 327, 330
– Pour 25 marques : 0, 22, 41, 42, 44, 56, 60, 106, 132, 137, 189, 191, 219, 235, 236, 244, 246, 259, 310, 315, 322, 343, 347, 353

Le Modulor de Le Corbusier

La nature est mathématique, les chefs-d’œuvre de l’art sont en consonance avec la nature ; ils expriment les lois de la nature et ils s’en servent.

Le Corbusier est un architecte, urbaniste et peintre française d’origine Suisse (1887-1965). Il a réalisé de nombreuses constructions en adoptant un module humain servant de base pour déterminer les dimensions des habitations comme celles de la Cité radieuse à Marseille en 1947. Il a appelé ce module le « modulor » : il s’agit d’un mot-valise composé sur « module » et « nombre d’or ». En effet, les proportions fixées par le modulor sont directement liées au nombre d’or. Le Modulor est né de l’observation de la nature, de l’étude des oeuvres d’art, de leurs tracés régulateurs (Choisy) et des travaux de Matila Ghyka consacrés au Nombre d’or dans la nature et dans l’art.

Le Corbusier affirmait que le Modulor (à l’échelle humaine) avait des avantages sur les deux systèmes de mesure qui divisent la planête : le système anglo-saxon du pied-pouce, peu pratique mais qui tient compte des mesures du corps, et le système métrique, décimal donc pratique, trop abstrait cependant, privé de  lien direct avec les dimensions du corps. Elle devait permettre, selon lui, un confort maximal dans les relations entre l’homme et son espace vital.

L’examen de ce dessin, qu’il a lui-même coté, montre :

1,83/1,13=1,619 soit le nombre d’or (à un millième près)

1,83-1,13=0,7 et 1,13/0,7=1,614 soit le nombre d’or (à 4 millième près)

De même, le rectangle des pieds de l’homme à sa tête est un rectangle d’or, c’est-à-dire que le rapport de ces cotés est égal au nombre d’or.

Le Corbusier a indiqué les dimensions de l’homme debout accoudé, puis assis, assis accoudé… et le rapport des dimensions est toujours

\phi, \phi^2, 1/\phi, \sqrt\phi

\phi est le nombre d’or.

Les chiffres retenus par Le Corbusier sont des valeurs approchées. L’exactitude mathématique le préoccupe moins que de proposer une échelle d’harmonie visuelle qui puisse guider l’action de l’architecte.

Sources :

La journée de pi

14/03/2010 Tukikun 3 commentaires

Aujourd’hui, Google se revêt d’un logo personnalisé (comme quelques fois dans l’année) pour une fois très mathématiques :

Google Piday 2010

Nous sommes le 14 mars (la date s’écrit 3/14 en format américain) et aujourd’hui on honore la constante mathématiques \pi. On la célèbre généralement à 1h59 (le matin si on utilise le format « 24h » et à quatorze heure moins une si on utilise le format « 12h ») dans les départements mathématiques de nombreuses universités pour obtenir l’approximation bien connue

\pi \approx 3,14159.

Pendant ces festivités, on imagine un monde sans pi, on mange des pie (tartes) en buvant de la piña colada…

Sur le logo de Google, on retrouve l’aide d’un cercle de rayon r :

\mathcal A = \pi r^2

la représentation graphique de la période d’un sinus (ou d’un cosinus), deux approximations de pi :

\frac{223}{71}<\pi<\frac{22}7,

(l’encradrement est dû à Archimède, en 350 av. J.-C.) les volumes d’une sphère de rayon r et d’un cylindre de hauteur h et de base un disque de rayon r :

\mathcal V_{\textrm{sph\`ere}}=\frac 43 \pi r^3, \qquad V_{\textrm{cylindre}}=h\pi r^2,

et finalement la circonférence d’un cercle de rayon r : 2\pi r.

Aujourd’hui, voir qu’on était la journée de \pi m’a rappelé un livre que j’ai lu récemment :

Je suis né un jour bleu, Daniel Tammet

Je suis né un jour bleu, de Daniel Tammet. Il s’agit d’une autobiographie écrite par un anglais atteint du syndrome d’Asperger, une forme d’autisme de haut niveau.

J’ai trouvé cette autobiographie très intéressante : elle permet en premier lieu de découvrir comment les autistes appréhendent le monde et nous aide à comprendre les réactions de ces derniers. Une autre chose extrêmement troublante et intrigante est la synesthésie du personnage : l’auteur nous montre comment il modélise les nombres et les mots par des formes et des couleurs, ce qui lui permet d’accomplir des prouesses extraordinaires telles que mémoriser plus de 22500 décimales du nombre \pi, faire des calculs mentaux aussi rapidement qu’une machine ou apprendre une nouvelle langue en quelques semaines. Ce record est le record européen et date du 15 mars 2004 : pendant 5 heures et 9 minutes, Danniel Tammet a énoncé les décimales de \pi en parcourant les paysages de son esprits représentés par le nombre \pi. Ce livre nous apprend beaucoup d’autre chose sur le regard d’un autiste sur le monde, mais ceci ne rentrerait pas vraiment dans le cadre de cet article.

L’année dernière, Daniel Tammet a d’ailleurs écrit un poème sur le nombre \pi à l’occasion de la journée du Pi 2009 :

PI

Three, One, Four, One, Five, and On
The numbers recount their endless tale.
Three – Barefoot green, a silent voice.
White as hunger, One is twice
Bright like babies’ eyes.
Four is timid, envious of E.
Five, Punctuation or a pregnant sigh
Precedes proud Nine, colour of falling night.
Two, an unfastened knot,
A wayward wind, the hollow of Six resounding.
Nearby, Eight, a cloud of fireflies above a lake
Over which I skim Sevens
Remembering that Zero is nothing but a circle.

On trouvera la traduction en français de ce poème, par Daniel Tammet lui-même, sur son blog. Ce poème rappelle bien évidemment les moyens mnémotechniques que l’on peut utiliser pour retenir les décimales du nombre \pi via un poème par exemple :

Que j’aime à faire apprendre ce nombre utile aux sages ! 3 1 4 1 5 9 2 6 5 3 5
Immortel Archimède, artiste ingénieur, 8 9 7 9
Qui de ton jugement peut priser la valeur ? 3 2 3 8 4 6 2 6
Pour moi, ton problème eut de pareils avantages. 4 3 3 8 3 2 7 9
Jadis, mystérieux, un problème bloquait 5 0 2 8 8
Tout l’admirable procédé, l’œuvre grandiose 4 1 9 7 1 6 9
Que Pythagore découvrit aux anciens Grecs. 3 9 9 3 7 5
Ô quadrature ! Vieux tourment du philosophe 1 0 5 8 2 9
Insoluble rondeur, trop longtemps vous avez 9 7 4 9 4 4
Défié Pythagore et ses imitateurs. 5 9 2 3 0
Comment intégrer l’espace plan circulaire ? 7 8 1 6 4 0
Former un triangle auquel il équivaudra ? 6 2 8 6 2 0
Nouvelle invention : Archimède inscrira 8 9 9 8
Dedans un hexagone ; appréciera son aire 6 2 8 0 3 4
Fonction du rayon. Pas trop ne s’y tiendra : 8 2 5 3 4 2 1 1 7
Dédoublera chaque élément antérieur ; 0 6 7 9
Toujours de l’orbe calculée approchera ; 8 2 1 4 8 0
Définira limite ; enfin, l’arc, le limiteur 8 6 5 1 3 2 8
De cet inquiétant cercle, ennemi trop rebelle 2 3 0 6 6 4 7
Professeur, enseignez son problème avec zèle 0 9 3 8 4 4

(la longueur de chaque mot donne une décimale (un mot de 10 lettres code zéro) et la ponctuation ne code rien.) et si jamais cela vous parait trop compliqué, vous pouvez toujours déclamer :

How I wish I could enumerate Pi easily, since all these horrible mnemonics prevent recalling any of pi’s sequence more simply.

Pi Pie

Bon, il est temps d’aller se préparer une bonne tarte chocolatée avec \pi pour fêter ce nombre si extraordinaire.

Et pour les colleurs de prépa en première année de la semaine prochaine, un petit exercice est tout indiqué pour faire travailler la décomposition en éléments simples :

En calculant l’intégrale

\displaystyle \int_0^1 \frac{x^4(1-x)^4}{1+x^2}\textrm{d}x,

montrer que \pi<\frac{22}7.

Bonne journée !

Pour aller plus loin, quelques liens :

Le troisième problème de Hilbert avec du produit tensoriel

26/02/2010 Tukikun 2 commentaires

En 1900, lors de l’Exposition Universelle, à Paris, a lieu le deuxième congrès de mathématiques. L’exposé de David Hilbert (1862-1943, mathématicien allemand, considéré comme un des plus grands mathématiciens du XXème siècle) est l’un des plus attendus. Le 8 août 1890, il présente donc sa liste de 23 problèmes qui tiennent les mathématiciens en échec et qui marqueront le cours des mathématiques du XXème siècle.

On s’intéresse dans cet article au troisième problème de Hilbert, qui est considéré comme le plus facile, et qui a eu une existence brève puisque la solution a été apportée par Dehn dès 1900. Il fallait spécifier deux tétraèdres de même base et de même hauteur, qui ne se subdivisent d’aucune manière en tétraèdres superposables, et qui ne se laissent pas compléter par des tétraèdres superposables en des polyèdres pour lesquels une telle subdivision en tétraèdres superposables soit possible (Ouf ! On peut respirer…). Autrement dit, si deux polyèdres ont même volume, peut-on produire un puzzle pour passer de l’un à l’autre ? Ou encore, si l’on a deux polyèdres de même volume, peut-on découper le premier en un nombre fini de morceaux (polyèdres) et obtenir le second en recollant les morceaux ?

La réponse à ce problème est négative. En particulier il est impossible de découper un cube en un nombre fini de polyèdres et de reconstituer un tétraèdre régulier (de même volume) à partir des morceaux. La démonstration de Dehn repose sur l’introduction d’un nouvel invariant appelé l’invariant de Dehn.

Découpages et recollements

Soient A et B deux parties de \mathbb R^d. On dit qu’elles sont équivalentes par découpage et recollement (ou équidécomposables) s’il existe une partition de A (resp. de B),

A=A_1 \cup A_2 \cup \cdots \cup A_n (resp. B=B_1 \cup B_2 \cup \cdots \cup B_n)

et, pour chaque i=1, 2, \ldots, n, une isométrie g_i:A_i\to B_i qui applique A_i sur B_i. On note alors A\sim B.

Cette relation est clairement une relation d’équivalence.

Polygones, polyèdres, tétraèdres

Afin de se mettre d’accord, il est nécessaire de définir clairement les notions de polygones (ou devrait-on dire de domaines polygonaux) dans le plan, de polyèdre et de tétraèdre dans l’espace.

Un polygone est une figure géométrique plane, formée d’une suite de segments, chacun d’entre eux partageant une extrémité avec le précédent et le suivant, délimitant ainsi un contour fermé. Par exemple, les triangles, les rectangles, les hexagones sont des polygones…

Un polyèdre est traditionnellement une forme tridimensionnelle qui se compose d’un nombre fini de faces polygonales qui sont des parties de plans; les faces se rencontrent par paires le long des arêtes qui sont des segments de droite, et les arêtes se rencontrent aux points nommés sommets.

Icosadodécaèdre

Un tétraèdre est un polyèdre dont les 4 faces sont des triangles. Il est dit régulier si ses 4 faces sont des triangles équilatéraux.

Découpage des polyèdres : pourquoi cette question ?

Nous connaissons tous la formule élémentaire qui donne l’aire d’un triangle : la base fois la hauteur divisé par deux. La preuve de ce résultat consiste à découper le triangle en petits polygones et à les réarranger afin d’obtenir un rectangle qui a la même aire.

Peut-on utiliser un argument semblable (c’est-à-dire une preuve par découpage et recollement) afin d’obtenir le volume d’une pyramide ? En effet, on obtiendrait une preuve « élémentaire » du théorème XII.5 d’Euclide (qui dit que deux pyramides de même base et de même hauteur ont même volume). Et nous obtiendrions ainsi une définition élémentaire du volume d’un polyèdre. En effet, Euclide utilise un processus infini, l’exhaustion (un passage à la limite). Les démonstrations ultérieures de cette formule font toutes appel à des méthodes relevant de près ou de loin à un calcul intégral et aucune démonstration géométrique plus simple n’a pu être trouvée.

Le tétraèdre régulier n’est pas équidécomposable avec le cube de même volume.

Pour prouver ce théorème, Dehn a introduit un nouvel invariant qui porte son nom : l’invariant de Dehn.

Invariant de Dehn, version produit tensoriel

Les sous-groupes de \mathbb R étant soit dense, soit de la forme \alpha\mathbb Z, \alpha\in\mathbb R^*, on a \pi\mathbb Z qui est un sous-groupe distingué (car (\mathbb R, +) est abélien) de \mathbb R. On peut ainsi considérer le groupe quotient \mathbb R/\pi\mathbb Z, qui peut être vu comme le groupe des angles de droite (au moyen de la mesure des angles en radians).

On pourra alors définir l’invariant de Dehn dans le produit tensoriel \mathbb R \otimes_{\mathbb Z} (\mathbb R/\pi\mathbb Z).

Par définition du produit tensoriel, on a une application \mathbb Z-bilinéaire naturelle

i : \begin{array}[t]{rcl}\mathbb R\times(\mathbb R/\pi\mathbb Z) & \to & \mathbb R\otimes_{\mathbb Z}(\mathbb R/\pi\mathbb Z)  \\ (a,\theta) & \mapsto & a\otimes\theta\end{array}

On a aussi une fonction \mathbb Z-bilinéaire

\overline f : \begin{array}[t]{rcl}\mathbb R\times(\mathbb R/\pi\mathbb Z) & \to & \mathbb R  \\ (a,\theta) & \mapsto & af(\theta)\end{array}

Par la propriété universelle du produit tensoriel, il existe une unique application \mathbb Z-linéaire

F : \begin{array}[t]{rcl}\mathbb R\otimes_{\mathbb Z}(\mathbb R/\pi\mathbb Z) & \to & \mathbb R  \\ a\otimes\theta & \mapsto & af(\theta)\end{array}

On peut ainsi définir l’invariant de Dehn indépendamment de la fonction f en l’exprimant dans le produit tensoriel.

Soit un polyèdre P dans l’espace. On définit l’invariant de Dehn de P comme le nombre réel :

\delta(P)=\sum_{e\in P}\ell(e) \otimes \alpha(e)

où l’on somme sur toutes les arêtes e du polyèdre, \ell(e) représentant la longueur de l’arête e et \alpha(e) l’angle entre deux faces dont l’intersection est e.

On a donc le théorème suivant :

Si deux polyèdres sont équidécomposables, ils ont le même invariant de Dehn.

qui repose sur le caractère additif de l’invariant de Dehn : si un polyèdre P est réunion disjointe de polyèdres P_1, \ldots, P_r, on a

\delta(P)=\delta(P_1)+\cdots+\delta(P_r)

On souhaite donc calculer l’invariant de Dehn du cube et celui du tétraèdre. Pour cela on a besoin d’un résultat préliminaire :

Un élément t=a\otimes\theta \in \mathbb R\otimes_{\mathbb Z}(\mathbb R/\pi\mathbb Z) , avec a\neq 0, est nul si et seulement si \frac\theta\pi est rationnel. En effet, si \frac\theta\pi = \frac pq, on a

t=(q\frac aq)\otimes\frac pq \pi = \frac aq \otimes (q\frac pq \pi) = \frac aq \otimes p\pi = \frac aq \otimes 0 = 0.

Supposons maintenant que \frac\theta\pi est irrationnel. Par la propriété universelle du produit tensoriel, étant donnés

\overline f : \begin{array}[t]{rcl}\mathbb R\times(\mathbb R/\pi\mathbb Z) & \to & \mathbb R  \\ (a,\theta) & \mapsto & af(\theta)\end{array} et i : \begin{array}[t]{rcl}\mathbb R\times(\mathbb R/\pi\mathbb Z) & \to & \mathbb R\otimes_\mathbb Z(\mathbb R/\pi\mathbb Z)  \\ (a,\theta) & \mapsto & a\otimes\theta\end{array}

deux applications bilinéaires, il existe une unique application \mathbb Z-linéaire

F : \begin{array}[t]{rcl}\mathbb R\otimes_\mathbb Z(\mathbb R/\pi\mathbb Z) & \to & \mathbb R  \\ a\otimes\theta & \mapsto & af(\theta)\end{array}

On aura gagné si on trouve f telle que f(\theta)\neq0. Comme \mathbb R est un \mathbb Q-espace vectoriel et qu’il existe des bases de \mathbb R comme \mathbb Q-espace vectoriel, et comme \theta et \pi sont \mathbb Q-indépendants, on les complète en une base et on envoie \pi sur 0 et \theta sur 1. Cet homomorphisme se factorise par \pi\mathbb Z et c’est ce que l’on désirait.

Preuve du théorème

Considérons le cube C. On utilisant la bilinéarité du produit tensoriel sur \mathbb Z on a

\delta(C)=\sum_{e\in C} \ell(e)\otimes \frac\pi2 = \sum_{e\in C} 2\frac{\ell(e)}2\otimes \frac\pi2 = \sum_{e\in C} \frac{\ell(e)}2\otimes 2\frac\pi2   = \sum_{e\in C} \frac{\ell(e)}2\otimes \pi = 0

Considérons maintenant le tétraèdre régulier T de volume 1 avec des cotés de longueur \ell (=6\sqrt2). En utilisant le résultat préliminaire et la liberté de la famille \{\alpha,\pi\}\alpha est tel que \cos \alpha = \frac 13, on a

\delta(T)=\sum_{e\in T} \ell(e)\otimes \alpha = \sum_{e\in T} \ell\otimes\alpha = 6 \underbrace{\ell\otimes \alpha}_{\neq0}\neq 0.

Jolie application du produit tensoriel non ?