Théorème ergodique de Von Neumann (L²): version en moyenne
L² du théorème 'pointwise' de Birkhoff
Sommaire
Introduction à la théorie ergodique
Un peu d'historique
1 Système Dynamique
2 L'étude des processus en théorie ergodique
3 Moyennes temporelles & moyennes micros canoniques
4 Dynamique continue
5 Théorie ergodique élémentaire
6 Théorème ergodique en moyenne
7 Théorème ergodique presque partout
8 Bilan Récapitulatif
9 Récapitulatif du Théorème ergodique de Birkhoff
10 Théorème de récurrence de Poincaré
11 Théorème ergodique de Von Neumann
12 Mélange
Conclusion
Liste de quelques auteurs
Introduction à la théorie ergodique
Le but du stage est le :
Théorème ergodique de Von Neumann (L²): version en moyenne L² du théorème 'pointwise' de Birkhoff.
Naïvement, l'ergodicité peut s'énoncer comme la propriété, pour un système mécanique donné, de converger en probabilité vers un état final indépendant de son état initial. Ergodique : Adjectif (en allemand Ergoden, et en grec hodos, chemin) Se dit, pour un processus(Suite d'opérations ou d'événements , évolution) aléatoire stationnaire, d'une hypothèse selon laquelle les caractéristiques statistiques(Science qui recueille et analyse mathématiquement des données pour une évaluation numérique), déduites des valeurs moyennes calculées à partir des valeurs à un même instant d'un grand nombre de réalisations différentes du processus considéré, coïncident avec celles qui sont déduites des valeurs successives dans le temps d'une quelconque de ces réalisations.
La théorie ergodique est née de l'étude de l'hypothèse ergodique.
L'hypothèse ergodique, ou hypothèse d'ergodicité
L'hypothèse ergodique (Ergodique vient du mot du grec ergon qui signifie = travail, énergie) pour un système isolé (conservant son énergie) consiste à exprimer que ces moyennes devraient converger avec le temps vers les mêmes limites que celles obtenues si on avait pu calculer les moyennes de chaque particule du système.
L'hypothèse ergodique, c'est supposer qu'au lieu de regarder l'évolution d'un système dans le temps, on peut regarder un grand nombre de systèmes à un instant donné. Mathématiquement, ça revient à remplacer les moyennes temporelles par des moyennes d'ensemble.
Notions de théorie ergodique : la
Théorie ergodique dit, pour résumer que, moyenne temporelle et moyenne spatiale coïncide.
En mathématiques, la théorie ergodique étudie le comportement limite des systèmes dynamiques en recherchant des propriétés invariantes. Ses outils sont la théorie de la mesure, le calcul des probabilités, les processus stochastiques, la géométrie différentielle.
Un peu d'historique
En 1868, le physicien autrichien Ludwig Boltzmann (1844-1906) étudie et décrit le mouvement des molécules dans les milieux gazeux (théorie cinétique des gaz) et crée quelques années plus tard (1877) la mécanique statistique.
Le physicien Ludwig Boltzmann a introduit l'hypothèse ergodique, selon laquelle un système mécanique “visite” de manière “égale” tout l'espace des phases disponible ; donc en attendant suffisamment longtemps, une structure apparaît, celle du parcours uniforme de tout l'ensemble. Il avait pour but de troquer des moyennes temporelles, à priori impossibles à calculer, contre des moyennes spatiales. Sa première formulation (une trajectoire typique remplit l'espace des phases) était grossièrement erronée. Il conjectura ensuite qu'une trajectoire typique était dense dans l'espace des phases. C'est la naissance de la théorie ergodique, qui aura une importance capitale en Physique théorique pendant plusieurs décennies.
C'est en effet d'un problème de mécanique que la théorie ergodique est issue. À l'origine se trouve une hypothèse de la théorie cinétique des gaz, audacieusement posée par
L. Boltzmann en 1885, qui permettait aux physiciens de résoudre une difficulté liée à l'étude des systèmes mécaniques à un très grand nombre de particules. L'importance de cette hypothèse, confirmée expérimentalement dans de nombreux cas, conduisit les mécaniciens à en chercher une justification théorique et ce sont les diverses tentatives faites dans cette voie qui marquent les débuts de la théorie ergodique. Après les résultats fondamentaux, obtenus par J. Von Neumann et G. D. Birkhoff en 1931 à quelques semaines d'intervalle, la théorie ergodique s'est développée au sein de la mathématique dans des directions diverses : analyse fonctionnelle et théorie des groupes ; calcul des probabilités et plus précisément processus markoviens ; théorie de l'information, etc.... Les méthodes ergodiques ont permis d'exposer différemment certains problèmes et de donner des prolongements nouveaux à ces branches de la mathématique.
En traitement du signal, l'hypothèse d'ergodicité consiste à admettre que l'évolution d'un signal aléatoire au cours du temps apporte la même information qu'un ensemble de réalisation.
La théorie ergodique constitue une réfutation de l'hypothèse ergodique.
La théorie ergodique est l'étude des systèmes dynamiques du point de vue de la théorie de la mesure. C'est un lieu de rencontre de divers domaines mathématiques: probabilités, géométrie, théorie des nombres, théorie des groupes classiques, systèmes dynamiques.
Dans les années 1950, Kolmogorov comprend que l'ergodicité n'est pas la règle : le théorème KAM permet de construire de nombreux systèmes non ergodiques. Cette découverte sonne le glas du règne de l'hypothèse ergodique en physique théorique. Entretemps, la théorie ergodique a acquis une importance considérable en mathématiques, où elle est devenue un outil précieux à de nombreux titres.
Système dynamique
La théorie ergodique est l'étude du comportement à long terme des
Systèmes préservant une certaine forme d'énergie.
De nombreuses recherches mathématiques concernent le comportement à long terme d'un système qui évolue dans le temps, appelé système dynamique.
Cette évolution est couramment modélisée par une transformation T de l'ensemble de tous les états possibles du système : si à un instant donné le système est dans l'état x, alors T(x) représente l'état du système à l'instant suivant.
La suite x, T(x), T(T(x)), ... des itérés d'un point x X constitue la trajectoire, ou encore l'orbite du point x.
D'un point de vue mathématique, un système physique peut être modélisé par la
donnée d'un espace X, d'une transformation T : X → X et d'une mesure μ définie sur
X, invariante par T : pour tout ensemble mesurable A ⊂ X, considérons un espace mesuré (X; A ; ) : X est un ensemble, A est une -algèbre de parties de X et est une mesure positive sur A. On dit qu'une transformation T : X X préserve la mesure si elle est
A -mesurable (i.e. pour tout A A, A), et si pour toute partie mesurable A, on a
T(μ) (A) = μ(T − 1(A)) = μ(A). On dit également dans ce cas que la mesure est
T -invariante.
Le quadruplet formé de l'espace X, de la mesure μ, de la tribu des ensembles
mesurables relativement à μ et de la transformation mesurable T qui préserve μ
forme ce qu'on appelle un système dynamique mesuré.
La théorie ergodique est un thème mathématique extrêmement vaste que l'on
pourrait tenter de résumer grossièrement à l'étude de la situation suivante : un
(semi-)groupe de transformations agit sur un espace mesuré
(X, A, μ), en préservant la mesure.
La théorie ergodique s'intéresse plus particulièrement au cas où l'espace d'états est muni d'une loi de probabilité P invariante par T : si A est une partie de l'espace d'états, P(A) s'interprète comme la probabilité qu'à un instant donné, l'état du système soit dans A. Dire que la probabilité P est invariante par T signifie que cette probabilité ne dépend pas de l'instant considéré.
L'étude des processus en théorie ergodique
Une fonction f définie sur l'espace d'états peut s'interpréter comme la mesure d'un paramètre de l'état du système. Une mesure n'étant, en pratique, jamais de précision infinie, on se place souvent dans le cas où f ne prend qu'un nombre fini de valeurs.
On appelle processus la suite
... f(x), f(T(x)), f (T2(x)),... des « valeurs Observées (des Observables) » au cours du temps.
De multiples questions étudiées en théorie ergodique concernent les propriétés de cette suite : comment ses termes sont-ils répartis ? Certains motifs se répètent-ils régulièrement ? Peut-on deviner la valeur de certains termes manquant dans la suite ?
Sur la figure ci-dessus, l'observation du processus défini par f fournit la suite
... 0 1 0 1 1 0 ...
L'espace X est composé de l'ensemble de tous les états que peut prendre le
système au cours de son évolution. La transformation T décrit son évolution au
cours du temps ; T(x) est l'état dans lequel se trouve le système au temps 1 s'il
se trouvait dans l'état x au temps 0. Les itérés successifs T (x), T (x),... donnent
l'état du système aux temps 2, 3, ... Enfin, la mesure μ correspond à n'importe quelle
quantité extensive, définie sur l'espace X, et préservée au cours du mouvement.
L'exemple de base vient de la mécanique classique. Il est donné par un point
matériel se déplaçant sous l'action d'un potentiel indépendant du temps. L'ensemble
X est l'espace (x, v) des positions-vitesses, aussi appelé espace des phases. La
transformation T associe à la condition initiale (x, v) les valeurs de position et de
vitesse après un laps de temps donné, par exemple 1 seconde, 1 jour ou 1 année,
selon les échelles de temps étudiées. Enfin, la mesure μ est le volume standard dxdv
défini sur l'espace X. Son invariance se déduit de la préservation de l'énergie.
On cherche à déterminer le comportement de la suite des itérés = T◦T◦...◦T.
Moyennes temporelles & moyennes micros canoniques
Soit f une « bonne » fonction sur X. On définit sa valeur moyenne temporelle par la limite (si elle existe) :
Ici, peut être remplacé par T.
Elle dépend à priori de la condition initiale x0. On peut également définir la moyenne spatiale de f, ou moyenne micro canonique, par :
La moyenne spatiale et la moyenne temporelle n'ont a priori pas de raison d'être égales.
Moyenne temporelle, moyenne spatiale
Comment se comporte la moyenne temporelle
(f(x) + f(Tx) + f(T2x) + ... + f (Tn-1x)) / n
des valeurs observées au cours de n instants successifs ?
Dans le cas où f ne prend que les valeurs 1 (sur une partie A de l'espace d'états) et 0 (en dehors de A), cette moyenne mesure la proportion du temps passé dans A entre l'instant 0 et l'instant n-1. Lorsque n est grand, on peut s'attendre à ce qu'elle soit proche de P(A), qui est la probabilité d'être en A à un instant donné. Si c'est effectivement le cas pour toute partie A, on dit que le système est ergodique.
L'ergodicité du système peut s'interpréter de la façon suivante : la répartition d'une suite d'états successifs x, T(x), T2(x),... est celle de tous les états possibles à un instant donné. On dit aussi que la moyenne temporelle coïncide avec la moyenne spatiale.
Les figures ci-dessus montrent la répartition de 100 états successifs pour deux valeurs différentes de l'angle .
Si mesuré en degrés est un nombre irrationnel (à gauche), la rotation est ergodique. Si est un rationnel (à droite, on a pris =45o), la périodicité empêche les états successifs de se répartir uniformément sur le cercle.
Théorème de Birkhoff (1931)
Lorsque l'application φ (ici : ou T) est ergodique, moyenne spatiale et moyenne temporelle sont égales presque partout. Ce résultat constitue le célèbre théorème ergodique de Birkhoff
L'objet d'étude en théorie ergodique est un triplet ((X, B), μ, Φ) où :
(X, B) est un espace mesurable, (c'est-à-dire que B est une tribu sur X)
μ une mesure sur (X, B),
une application préservant la mesure μ, c'est-à-dire telle que :
L'application engendre une dynamique discrète : partant d'un point , on obtient successivement x1 = φ(x0), puis x2 = φ(x1) = φ2(x0), et ainsi de suite.
Dynamique continue
On peut étendre l'étude au cas d'une dynamique continue en remplaçant l'application précédente par un flot sur X, c'est-à-dire un groupe continu à un paramètre tel que :
Ce cas est particulièrement important puisqu'il inclut le flot hamiltonien de la mécanique classique, ainsi que le flot géodésique.
L'« hypothèse ergodique » a été formulée dans l'étude du système formé de particules dans un domaine en dimension 3, pour lequel on suppose connues les masses et les forces exercées. En mécanique classique déterministe l'évolution de l'état instantané du système peut être décrite par un flot de transformations à un paramètre (un système dynamique) opérant sur l'espace des phases et laissant invariante la mesure naturelle sur cet espace. L'hypothèse ergodique revient à supposer que la « plupart », des trajectoires s'équirépartissent, en un certains sens, sur les surfaces d'énergie constante de l'espace des phases et permet de remplacer asymptotiquement les moyennes temporelles par les moyennes spatiales.
Donnons quelques définitions de base de la théorie ergodique :
On a déjà vu qu'un système dynamique mesuré est la donnée de (X, A, μ, T) où :
A est une -algèbre sur X. μ est une mesure définie sur A.
T : X X est A-mesurable, et préserve μ, i.e. pour tout
A, A et μ ( ) = μ ( ).
Lorsque X est un espace topologique, on notera (X, μ, T) = (X, Bor(X), μ, T).
Le but de la théorie ergodique est alors d'étudier le comportement de , ou plus précisément, de
, où x X.
Le système dynamique (X, μ, T) (ou plus généralement
(X, A, μ, T)) est ergodique si tout Bor(X) (ou plus généralement A) T-invariant (i.e. qui vérifie
= ) est de mesure 0 ou 1.
Ceci traduit le fait qu'on ne peut pas partitionner X en 2 ensembles de mesures strictement positives sur lesquels T agirait séparément.
Pour récapituler, si (X, T, μ) un espace mesuré, T : X → X une application mesurable qui préserve la mesure μ : la transformation T est dite ergodique relativement à la mesure μ si les seuls ensembles mesurables invariants sont de mesure nulle ou de complémentaire de mesure nulle :
implique μ ( ) = 0 ou μ ( ) = 0
L'application T ou est dite ergodique pour une mesure donnée si et seulement si tout ensemble mesurable invariant sous est de mesure nulle, ou de complémentaire de mesure nulle.
L'ergodicité capture la notion d'irréductibilité en théorie de la mesure : pour toute partition d'un système dynamique ergodique en deux sous-systèmes invariants, l'un de deux est trivial ou négligeable, au sens où il vit sur un ensemble de mesure nulle.
Une application satisfaisant cette propriété était autrefois également dite « métriquement transitive ».
Théorie ergodique élémentaire
Donnons maintenant quelques définitions relatives aux systèmes dynamiques topologiques :
T est minimal si x X, { : n N} est dense dans X.
Lorsque la transformation est minimale, l'orbite de tout point (l'ensemble des , n N) ”visite” donc l'intégralité de X, au sens où elle rencontre tout ouvert de X.
Soit (X, A) un ensemble muni d'une -algèbre, et T : X X une
application A-mesurable. (X, A, T) sera dit uniquement ergodique s'il existe une unique
mesure μ préservée par T.
Remarque : Lorsque X est un espace topologique, on notera (X, T) à la place de
(X, Bor(X), T).
On peut se demander pourquoi le terme « ergodicité » intervient dans cette définition. Cela
découle, en fait, de la proposition suivante :
Si (X, A, T) est uniquement ergodique, alors, en notant μ l'unique
mesure T-invariante, (X, A, μ, T) est ergodique.
Démonstration : Soit A A T-invariant. Nous allons montrer que μ(A) {0, 1}.
Soit B le complémentaire de A dans X.
B est également T-invariant. Définissons alors la mesure suivante :
Pour tout E A, (E) = , où est une constante telle que
(X) = 1, plus précisément = μ(A) + μ(B) = (2 − μ(A)).
On vérifie sans peine que est T-invariante. Donc par unique ergodicité, = μ, en particulier
μ(A) = (A) =
, ce qui donne μ(A) {0, 1}.
Théorème ergodique en moyenne
Introduisons :
Où opérateur et agit sur les observables
La remarque suivante, due à B. O. Koopman (1931), est cruciale pour ce qui va suivre.
Si on fait opérer par composition la transformation T sur l'espace
(X, μ) des fonctions de carré intégrable, l'application
U obtenue est une isométrie linéaire : si f ∈ et
Uf = f◦T, alors ||Uf|| = ||f||. Ceci découle de l'invariance de μ par T. On peut
donc appliquer les techniques d'analyse hilbertienne pour étudier le comportement
“en moyenne” de la suite f◦Tn, c'est-à-dire son comportement en norme .
En passant à l'action sur l'espace , on a remplacé un problème à priori non
linéaire, disons en dimension finie, par un problème linéaire en dimension infinie.
A-t-on vraiment gagné au change ? Le point est que l'espace de Hilbert possède un
certain nombre de propriétés réminiscentes de la dimension finie. La plus utile est
la compacité faible de sa boule unité. Montrer une convergence faible revient donc à
identifier la limite par le biais d'une propriété qui la caractérise de manière unique,
tâche qui s'avère en général plus simple que celle de montrer la convergence.
Ces méthodes Hilbertiennes permettent d'obtenir la convergence des moyennes
, pour toute application linéaire U satisfaisant : ∀f, ||Uf|| ≤ ||f||.
Ce résultat, initialement obtenu par J. Von Neumann (1932) dans un contexte un peu
différent par des méthodes de calcul fonctionnel, illustre un fait fréquemment utilisé
en analyse, comme quoi “moyenner tend à régulariser”.
Voici une conséquence du théorème ergodique : si l'espace X est de mesure finie,
alors presque toute trajectoire revient arbitrairement proche de son état initial.
C'est l'une des rares conclusions générales qu'on puisse faire sur le caractère du
mouvement en mécanique classique. Antérieur au théorème ergodique, ce résultat,
démontré par H. Poincaré en 1899, est souvent considéré comme le premier résultat
mathématique de la théorie ergodique, et marque la naissance de cette discipline.
Notions de théorie ergodique et en particulier le théorème ergodique de Birkhoff : la
Théorie ergodique dit, pour résumer que, moyenne temporelle et moyenne spatiale coïncide.
Plus précisément, si l'on considère une bijection u et « mu : » une mesure invariante par ce difféomorphisme : alors, pour une fonction f mesurable pour cette mesure et de carré intégrable (en gros si tu peux définir les intégrales), l'intégrale de f correspond à la limite de la moyenne des N premiers points de l'application u, et ce, quels que soit la donnée initiale.
La théorie ergodique est une source importante de théorèmes de forme probabiliste. En voici deux exemples classiques : étant donné un espace de probabilité (X, μ) et
T : X X un endomorphisme (c'est-à-dire qu'il préserve la mesure),
(1) le théorème de récurrence de Poincaré dit que l'orbite de μ-presque tout point revient arbitrairement proche de la condition initiale
(2) le théorème ergodique de Birkhoff dit que pour toute
Observable intégrable f : X R intégrable, la moyenne de f le long de μ-presque toute orbite converge. Nous dirons d'un point qu'il est typique s'il vérifie le théorème de Birkhoff pour toute observable continue bornée.
Théorème ergodique presque partout
Comme déjà vu précédemment, sur un système dynamique, modélisé par la donnée d'un certain espace d'états X, d'une transformation T : X → X décrivant l'évolution du système au cours du temps, et d'une mesure finie μ représentant une quantité extensive conservée au cours du mouvement. On cherche à étudier la suite { }, qui représente la succession des états que le système adopte au cours du temps. Cette suite constitue la trajectoire du point x, ou encore son orbite.
Intéressons nous au comportement asymptotique de cette suite.
Pour cela, considérons une certaine quantité Observable f : X →R et étudions son évolution au cours du temps.
Les quantités : Sn(f) (x) = sont appelées sommes de Birkhoff de la fonction f et les moyennes :
sont les moyennes de Birkhoff. Birkhoff montre en 1932 que la suite des
moyennes converge pour presque tout x ∈ X, dès que la fonction f est
intégrable. Lorsque f est la fonction indicatrice d'un certain ensemble A ⊂ X, ces
moyennes correspondent aux fréquences de passage, entre les temps 0 et n−1, des
itérés de x dans l'ensemble A. Ces fréquences convergent, et la limite est le temps
moyen passé par x dans A au cours de son déplacement.
Sans doute l'idée la plus naturelle pour attaquer un problème, est de chercher à le
subdiviser en plusieurs sous-problèmes, qui seront avec un peu de chance plus facile
à traiter que le problème initial. Pour étudier la dynamique d'une transformation,
on peut chercher à “casser” l'espace X en plusieurs morceaux disjoints, chacun de
mesure non nulle, de façon à ce qu'on puisse restreindre la transformation à chacun
de ces morceaux. Si cela n'est pas possible, le système est dit ergodique.
Lorsqu'un système est ergodique, il est possible de calculer explicitement la limite
des moyennes de Birkhoff . Cette limite ne dépend pas de x et s'obtient
en moyennant f sur X relativement à la mesure considérée.
On peut donc dire que pour un système ergodique,
“Les moyennes temporelles coïncident avec les moyennes spatiales.”
Le théorème ergodique de Birkhoff permet donc de passer d'une propriété de nature
qualitative : pas d'ensembles invariants non triviaux, à un énoncé quantitatif : la
fréquence de passage dans un ensemble quelconque est proportionnelle à la taille
de cet ensemble. En particulier, les trajectoires visitent tout l'espace au cours du
mouvement, si le système est ergodique.
Bilan Récapitulatif
Cas discret :
Espace métrique T : application
Exemple : = (cercle) et T une rotation où T=2x (modulo 1)
T décrit l'évolution des états w état initial
Son évolution : w, Tw, T w, ....
Observables (exemple : énergie) f :
° w état initial
° On étudie les moyennes des Observables le long de l'évolution de l'état w : ce qui se traduit par :
Question :
Est-ce que la limite quand existe ? Si oui, quelle est-elle ?
Réponse : Condition Système ergodique
Cas continu :
° Moyenne des Observables sur un intervalle de temps
On étudie la limite quand .
° Existence ? (Ergodicité)
Si elle existe :
F (mesurable)
Dynamique et Observable
x . . . .
:
:
T est ergodique si les ensembles F tels que
Récapitulatif du Théorème ergodique de Birkhoff
Malgré sa définition d'apparence simple, l'ergodicité est en fait une notion très puissante
comme le montrent le théorème suivant :
Théorème ergodique de Birkhoff :
Soit (X, A, μ, T) un système dynamique mesuré, et f (X; A ; μ).
Alors il existe une fonction (X; A ; μ) T-invariante presque partout telle que :
(i) pour presque tout x X
(ii) =
(iii) Si de plus T est ergodique, alors est constante et =
avec est ergodique et
Cette dernière formule correspond en fait à l'égalité entre la moyenne spatiale et la
moyenne temporelle de la fonction f. En effet, si le système est ergodique, en prenant pour
f la fonction caractéristique d'un ensemble mesurable, on obtient que, pour presque tout
point, la proportion de temps passé dans un ensemble, est égale à sa mesure.
Pour n'importe quel f (X; A ; μ),
Existe « pointwise » presque partout et est une fonction (X; A ; μ) T-invariante presque partout :
Voyons maintenant une caractérisation de l'unique ergodicité (dont on pourra trouver une
démonstration) :
Théorème: Soit X un espace topologique et T : X X une application
continue, alors les propositions suivantes sont équivalentes
(i)
, converge uniformément vers une constante.
(ii)
, converge en chaque point vers une constante.
(iii)
T-invariante, telle que et x X
(iv) T est uniquement ergodique
Proposition : Si (X, T) est uniquement ergodique, et si l'unique mesure T-invariante
charge les ouverts (i.e. tout ouvert est de mesure non nulle) alors T est minimal.
Démonstration : Soit U un ouvert de X et x X. Soit F un fermé inclus dans U et f
une fonction continue valant 1 sur F et 0 en dehors de U. Alors, par la caractérisation
ci-dessus, on en déduit qu'il existe une infinité de i tels que 0 et donc tels que
U. Par conséquent, T est minimal.
Remarque : Toutes les définitions et les théorèmes précédents sont encore valables si
l'on remplace la transformation et ses itérées par un flot , quitte à remplacer les
sommes :
par des intégrales :
.
Corollaire
Avec les mêmes hypothèses et en supposant en plus, que la mesure μ soit ergodique, on a :
= pour μ presque tout x.
Remarques
La somme s'appelle une moyenne de Birkhoff de f.
La limite lorsqu'elle existe s'appelle la moyenne orbitale (ou temporelle) de f.
L'intégrale est la moyenne spatiale de f.
Ainsi, le théorème dit que si μ est une mesure de probabilité ergodique, presque toutes les moyennes temporelles d'une fonction intégrable coïncident avec sa moyenne spatiale.
La loi forte des grands nombres est un cas particulier de ce théorème.
Quelques applications simples
Exemple
Soit B un ensemble mesurable non négligeable (μ(B) > 0). Si μ est ergodique, alors pour presque tous x de X, on a :
tel que
La proportion de temps que l'orbite de x passe dans B est précisément μ(B).
Exemple 2
Pour presque tout x , le nombre moyen de zéros dans l'écriture décimale de x (c'est-à-dire que x = 0,a1a2a3... où a1 est le chiffre des dixièmes de x, a2 le chiffre des centièmes de x, etc ) est égale à .
Théorème de récurrence de Poincaré
Soit (X, T, μ) un espace mesuré et T : X → X une application mesurable qui
préserve μ. On suppose que μ(X) < +∞. Soit B ⊂ X un ensemble mesurable.
Alors pour presque tout x ∈ B, il existe une infinité de n ∈ N tels que ∈ B.
Preuve
Si la trajectoire de x ne passe qu'un nombre fini de fois dans B, on a :
.
Mais le théorème ergodique montre qu'il existe une sous-suite , telle que pour pp
x ∈ X, cette somme converge vers , quantité qui est strictement positive
pour pp x ∈ B.
Considérons un système dynamique (X; A ; μ ; T) et A une partie mesurable de X. On cherche à estimer la proportion du temps passé dans A, c'est-à-dire étudier quand n +
le comportement des moyennes temporelles
Plus généralement, si f est une fonction mesurable sur X à valeurs dans R ou C, on définit pour tout entier n >1 les sommes partielles
=
et on voudrait étudier l'éventuelle limite (en un sens à préciser) des moyennes temporelles .
Le premier résultat important dans ce domaine est dû à
John Von Neumann (1932), et concerne la convergence de ces moyennes dans (en prenant évidemment f dans au départ).
Théorème ergodique de Von Neumann
Soit H un espace de Hilbert et U : H → H une contraction : ∀ f ∈H, ||Uf|| ≤ ||f||.
Posons = , Inv = {f ∈ H | Uf = f}, et notons P : H → H le
projecteur orthogonal sur le sous-espace Inv des vecteurs U-invariants. Alors :
Preuve
Montrons que tout élément g ∈ H invariant par U est invariant par l'adjoint U :
||g −U g|| = ||g|| + || U g || − 2<g, U g> 2||g|| − 2<Ug, g> = 2<g−Ug, g>
Un calcul similaire montre que tout élément g invariant par U est invariant par U.
Comme
si ∈Inv, il suffit de montrer que pour ∈Inv .
On a l'égalité : || || = ,
Il suffit donc de montrer que la suite converge faiblement vers 0, pour
tout f ∈ Inv . Pour cela, vérifions que les valeurs d'adhérence de cette suite sont toutes nulles. Comme elles sont dans Inv , il suffit de montrer qu'elles sont invariantes par U ou par U , ce
qui découle de la majoration suivante :
|| (I −U ) || ≤ ||(I −U )|| || || ≤ ||f||
Théorème ergodique
Soit (X, T, μ) un espace mesuré,
T : X → X une application mesurable qui préserve μ, et f ∈ . Alors,
Où P est le projecteur orthogonal sur le sous-espace {f ∈ | f ◦ T = f}
Preuve
Il suffit d'appliquer le théorème précédent à l'isométrie de donnée par Uf = f ◦T.
Le théorème ergodique en moyenne
Opérateur unitaire associé à une transformation préservant la mesure
Introduisons ici un outil essentiel dans l'étude des systèmes dynamiques. Si T est une transformation préservant la mesure sur un espace mesuré (X; A ; μ), on définit sur (X; A ; μ) l'opérateur par :
, = :
On vérifie facilement que
est linéaire, et puisque T préserve μ, on a :
, =
ainsi est une isométrie de (X; A ; μ).
Si de plus T est inversible et bimesurable (notamment si T est un automorphisme d'un espace de Lebesgue), alors est lui-même inversible, c'est donc un opérateur unitaire de (X; A ; μ). Comme on le verra plus tard, de nombreuses propriétés de la transformation T peuvent s'exprimer en termes de l'opérateur .
Si maintenant on s'intéresse à la convergence dans des moyennes pour
, on est ramené à l'étude, dans un espace de Hilbert H, des moyennes ,
où U est une isométrie de H.
Le théorème ergodique dans
On se place donc ici dans le cadre d'une isométrie U agissant sur un espace de Hilbert H. Il existe alors un sous-espace de H qui joue un rôle important dans l'étude des moyennes
: c'est le sous-espace I des vecteurs U-invariants, c'est-à-dire des f tels que = . Il est immédiat que I est un sous-espace fermé de H, et que si I, toutes les moyennes sont égales à .
Appelons maintenant un cobord tout élément de H qui s'écrit
, avec H. Là encore, l'ensemble C des cobords est un
sous-espace de H, mais qui n'est pas fermé en général.
Les moyennes sont également simples à étudier lorsque
est un cobord.
En effet, si = , on a
Notons que, C étant inclus dans l'orthogonal de I (c'est facile à vérifier !), 0 est la projection orthogonale du cobord f sur I. La généralisation de ce résultat à tous les vecteurs de H se déduira facilement du lemme suivant.
Lemme
Le sous-espace C des cobords est dense dans l'orthogonal du sous-espace I des vecteurs invariants.
Preuve - Il suffit de montrer que si un vecteur f est orthogonal à la fois à I et à C, il est nul. Or, si f est un tel vecteur, comme est un cobord, on a = 0,
d'où :
Ceci entraîne , c'est-à-dire f I. Et comme f I, on en déduit f = 0.
Théorème (Von Neumann, 1932)
Soit U une isométrie d'un espace de Hilbert H, et
Soit la projection sur le sous-espace fermé I de H constitué des vecteurs invariants par U.
Alors, pour tout f H, on a
(1)
Preuve - On a déjà vu que si f I ou si f C, f vérifie (1). Par ailleurs, il est facile de voir que l'ensemble des f H pour lesquels la convergence (1) a lieu est un sous-espace fermé de H. Or, d'après le lemme, le plus petit sous-espace fermé contenant à la fois C et I est H tout entier.
H est un espace de Hilbert et U : H H un opérateur isométrique dans H
Inv est le sous-espace des vecteurs f ∈ H invariants par U : i.e. : Inv = {f ∈ H / Uf = f} : les vecteurs U-invariants.
est l'opérateur de projection orthogonale sur Inv.
P : H H le projecteur Orthogonal sur le sous-espace Inv des vecteurs U-invariants.
Si f Inv, alors
Et donc le théorème est valide pour un tel f.
Appelons maintenant : un Cobord tout élément de H qui s'écrit : Uh-h avec h ∈ H.
L'ensemble des Cobords est un sous-espace de H (mais qui n'est pas fermé en général)
Si f est un Cobord : f = Uh-h,
= = ≤
D'autre part, si f est de la forme : Uh-h, ∀h∈H
Donc si f est un Cobord de la forme : Uh-h, ∀ h ∈ H : on aura :
En fait, ∀ g ∈ Inv, nous aurons : (f, g) = (Uh-h, g) = (Uh, g)- (h, g) = (Uh, Ug)- (h, g)= 0
Donc :
, i.e. :
Et donc, la déclaration du théorème est valide pour tout Cobord.
Supposons que C : ensemble des Cobords tel que ce soit un sous-espace fermé de H.
Supposons que C soit un sous-espace fermé de H.
C : ensemble des Cobords tel que ce soit un sous-espace fermé de H.
∀ f ∈ C et ε>0, nous avons :
Tel que :
Donc :
Et depuis que ε était arbitraire, nous obtenons finalement :
IL découle :
à la condition que f ∈ C.
Maintenant montrons que H = Inv ⊕ C, i.e. que : C┴ = Inv
Où C est le complément orthogonal à C sous-espace fermé de H.
IL s'ensuit de : (f, g)=0 que : Inv ⊂ C┴
Avec ∀ g ∈ Inv, ∀ f ∈ C où C est un fermé dans H
Si f ∈ C┴ : supposons f ∈ C┴, donc pour tout h ∈ H, nous avons :
(f, Uh-h) = 0 i.e. : (f, h) = (f, Uh) = (U*f, h)
Donc : U*f-f = 0 : f ∈ Inv : i.e. : C┴ ⊂ Inv :
on a supposé que f ∈ C┴ : puisque f ∈ Inv : on a alors : C┴ ⊂ Inv
L'égalité est donc prouvée : C┴ = Inv
Maintenant n'importe quel vecteur f ∈ H peut être représenté sous la forme : f = f1+ f2,
f = f1 + f2 où f1 ∈ Inv, f2 ∈ C
Donc : f = f1 + f2 où f1 ∈ Inv, f2 ∈ C
+ + =
= +
Le Théorème a été démontré.
Le théorème ergodique ponctuel
Le théorème ergodique en moyenne, s'il renseigne sur le comportement global des moyennes
, ne donne en revanche aucune précision sur la convergence, en un point x donné,
de la suite .
Cette convergence ponctuelle a été obtenue par Birkhoff, à qui l'on doit le
Théorème de Birkhoff (1931).
Bien qu'ayant démontré son théorème après Von Neumann, Birkhoff a publié son résultat un peu plus tôt.
Mélange
Définition
Soit (X, T, μ) un espace probabilisé et T : X → X une application mesurable qui
préserve la mesure μ. La transformation T est mélangeante relativement à la mesure
μ si elle vérifie :
∀ A, B ⊂ X mesurables, μ( ∩ ) μ ( ) μ ( ). cf. fig.1.
Théorème
Une transformation mélangeante est ergodique.
Preuve
Soit A ⊂ X un ensemble invariant ; comme , on doit avoir
∩ et le mélange implique , c'est-à-dire ou .
Exemple de la multiplication par 2 :
On considère la transformation de [0,1[dans [0,1[donnée par :
T(x) = 2x si x ∈ [0, [
T(x) = 2x − 1 si x ∈ [ , 1[
Montrons qu'elle préserve la mesure de Lebesgue et qu'elle est mélangeante.
L'image réciproque d'un intervalle [a, b] par T est une union disjointe de
2 intervalles de longueur .
La transformation conserve donc la mesure de Lebesgue.
Pour démontrer le mélange, on peut se restreindre au cas où A est de la forme
[k/ , k + 1/ [, n ∈ N, 0 ≤ k ≤ − 1 car ces intervalles engendrent la tribu
des boréliens. L'ensemble [k/ , (k + 1)/ [est composé des intervalles suivants :
(i entier). Si n+N n', l'intersection de ces intervalles avec B = [k'/ , k'+ 1/ [
est constituée de intervalles de longueur , ce qui donne la relation
recherchée : μ( ∩ ) = μ ( ) μ ( ).
CONVERGE pointwise = CONVERGE simplement, CONVERGENCE pointwise = CONVERGENCE simple
Pour n'importe quel f (X; A ; μ),
Existe « pointwise » presque partout et est une fonction
(X; A ; μ) T-invariante presque partout :
Théorème (Von Neumann, 1932)
Soit U une isométrie d'un espace de Hilbert H, et
Soit la projection sur le sous-espace fermé I de H constitué des vecteurs invariants par U.
Alors, pour tout f H, on a
(1)
CONCLUSION
La Théorie ergodique est une branche des mathématiques qui étudie les systèmes dynamiques avec une mesure invariante et les problèmes connexes. Son développement initial a été motivé par des problèmes de physique statistique. Un aspect central de la théorie ergodique est le comportement d'un système dynamique où il est autorisé à long terme. Cela est exprimé par le biais des théorèmes ergodiques qui affirment que, sous certaines conditions, le temps moyen d'une fonction selon les trajectoires existe presque partout et est liée à la moyenne de l'espace. Deux exemples les plus importants sont les théorèmes ergodiques de Birkhoff et Von Neumann. Pour la catégorie spéciale des systèmes ergodique, la moyenne temporelle est la même pour presque tous les points de départ: statistiquement parlant, le système qui évolue depuis longtemps "oublie" son état initial. Des propriétés plus fortes, telles que le mélange et équidistribution ont également été longuement étudiée. Le problème de la classification des métriques de systèmes est un autre élément important de la théorie ergodique abstraite. Un rôle remarquable dans la théorie ergodique et ses applications aux processus stochastiques est joué par les différentes notions d'entropie pour des systèmes dynamiques. Les applications de la théorie ergodique à d'autres parties des mathématiques impliquent généralement d'établir les propriétés d'ergodicité pour des systèmes d'un genre particulier. En géométrie, les méthodes de la théorie ergodique ont été utilisés pour étudier le flot géodésique sur une variété riemannienne, à commencer par les résultats de Eberhard Hopf pour les surfaces de Riemann de courbure négative. Les Chaînes de Markov forment un cadre commun pour des applications dans la théorie des probabilités. La Théorie ergodique a des liens fructueux avec l'analyse harmonique, la théorie de Lie (théorie de la représentation, treillis dans les groupes algébriques), et la théorie des nombres (la théorie des approximations diophantiennes, fonctions L).
Liste de quelques auteurs
Ludwig Boltzmann (1844-1906) : Physicien autrichien qui a contribué à établir les bases de la mécanique statistique.
John Von Neumann (1903-1957) : Il a apporté d'importantes contributions tant en mécanique quantique, qu'en analyse fonctionnelle, en théorie des ensembles, en informatique, en sciences économiques.
George David Birkhoff (1884,1944): était un mathématicien américain, connu pour ce qui est maintenant appelé le théorème ergodique.
Andreï Nikolaïevitch Kolmogorov (1903, mort en 1987 à Moscou) est un mathématicien russe dont les apports en mathématiques sont considérables. Il a fait des avancées significatives dans des domaines aussi variés que : la fondation des probabilités, la théorie algorithmique de l'information, les systèmes dynamiques, dont le théorème KAM dans les années 1950, la topologie.
Bernard Osgood Koopman (1900-1981) était un mathématicien américain d'origine française, connu pour son travail en théorie ergodique, les bases des probabilités, la théorie statistique et la recherche opérationnelle.
Henri Poincaré (1854, 1912) est un mathématicien, physicien et philosophe français. Il a réalisé des travaux d'importance majeure en optique et en calcul infinitésimal. Ses avancées sur le problème des trois corps en font un fondateur de l'étude qualitative des systèmes d'équations différentielles et de la théorie du chaos ; il est aussi un précurseur majeur de la théorie de la relativité restreinte.
Henri-Léon Lebesgue (1875 - 1941) est un mathématicien français. Il est reconnu pour sa théorie d'intégration publiée initialement dans sa dissertation Intégrale, longueur, aire à l'université de Nancy en 1902. Il fut l'un des grands mathématiciens français de la première moitié du vingtième siècle.
David Hilbert (1862, 1943) est un mathématicien allemand. Il est souvent considéré comme un des plus grands mathématiciens du XXe siècle, au même titre qu'Henri Poincaré. Il a créé ou développé un large éventail d'idées fondamentales, que ce soit la théorie des invariants, l'axiomatisation de la géométrie ou les fondements de l'analyse fonctionnelle (avec les espaces de Hilbert).