Aller au contenu

Méthode des moindres carrés

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 9 novembre 2005 à 01:17 et modifiée en dernier par RobotE (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.


polynômes d'approximation

La méthode des moindres carrés, indépendamment élaborée par Gauss et Legendre permet de comparer des données expérimentales, généralement entachées d’erreurs de mesure à un modèle mathématique censé décrire ces données.

Ce modèle peut prendre diverses formes. Il peut s’agir de lois de conservation que les quantités mesurées doivent respecter. La méthode des moindres carrés permet alors de minimiser l’impact des erreurs expérimentales en « ajoutant de l’information » dans le processus de mesure.

Dans le cas le plus courant, ce modèle est une famille de fonctions d’une ou plusieurs variables muettes , indexées par un ou plusieurs paramètres inconnus. La méthode des moindres carrés permet de sélectionner parmi ces fonctions, celle qui reproduit le mieux les données expérimentales. On parle dans ce cas d’ajustement par la méthode des moindres carrés. Si les paramètres ont un sens physique la procédure d’ajustement donne également une estimation indirecte de la valeur de ces paramètres.

La méthode consiste en une prescription (initialement empirique) qui est que la fonction qui décrit "le mieux" les données est celle qui minimise la somme quadratique des déviations des mesures aux prédictions de .

Si par exemple, nous disposons de mesures , les paramètres "optimaux" aux sens de la méthode des moindres carrés sont ceux qui minimisent la quantité:

Si, comme c'est géneralement le cas, on dispose d'une estimation de l'ecart-type de chaque mesure (l'erreur qui affecte chaque ), on l'utilise pour "peser" la contribution de la mesure au . Une mesure aura d'autant plus de poids que son erreur sera faible:

La quantite ci-dessus est appelee khi-deux. Son nom vient de la loi statistique qu'elle decrit, si les erreurs de mesure qui entachent les sont normalement distribuées (ce qui est tres courant).

Dans ce dernier cas, la méthode des moindres carrés permet de plus d’estimer quantitativement l’adéquation du modèle aux mesures, pour peu que l'on dispose d'une estimation fiable des erreurs . Si le modèle d’erreur est non gaussien, il faut généralement recourir à la méthode du maximum de vraisemblance, dont la méthode des moindres carrés est un cas particulier.

Son extrême simplicité fait que cette méthode est très couramment utilisée de nos jours en sciences expérimentales. Dans de nombreux cas, la quantité que l’on cherche à mesurer n’est pas observable et n’apparait qu’indirectement comme paramètre d’un modèle théorique. Dans ce dernier cas de figure, il est possible de montrer que la méthode des moindres carrés est un estimateur de ces paramètres, qui vérifie certaines conditions d’optimalité. En revanche, cet estimateur peut être parfois biaisé. Par ailleurs, il est extrêmement sensible aux points aberrants : on traduit ce fait en disant qu’il est non robuste. Plusieurs techniques permettent cependant de « robustifier » la méthode.

Formalisme

Deux exemples simples

Moyenne d'une série de mesures indépendantes

L'exemple le plus simple d'ajustement par la methode des moindres carres est probablement le calcul de la moyenne d'un ensemble de mesures indépendantes entachées d'erreurs gaussiennes. La prescription des moindres carrés revient à minimiser la quantité:

Cette quantite est une forme quadratique definie positive. Son minimum se calcule par differentiation: . Ce qui donne la formule usuelle:


Régression linéaire

Un autre exemple est l'ajustement d'une loi lineaire du type sur des mesures indépendantes, fonction d'un paramètre connu . Ce type de situation se recontre par exemple lorsque l'on veut calibrer un appareil de mesure simple (ampèremètre, thermomètre) dont le fonctionnement est lineaire. est alors la mesure instrumentale (déviation d'une aiguille, nombre de pas d'un ADC, ...) et la grandeur physique qu'est censé mesurer l'appareil, generalement mieux connue, si l'on utilise une source de calibration fiable. La méthode des moindres carrés permet alors de mesurer la loi de calibration de l'appareil, d'estimer l'adéquation de cette loi aux mesures de calibration (i.e. dans le cas présent, la linéarité de l'appareil) et de propager les erreurs de calibration aux futures mesures effectuées avec l'appareil calibré. A noter qu'en general, les erreurs (et correlations) portant sur les mesures et les mesures doivent etre prises en compte. Nous traiterons ce cas general dans la section consacree aux ajustements de modeles implicites.

La prescription des moindres carrés s'ecrit pour ce type de modèle:

Le minimum de cette expression est atteint pour , ce qui donne:

La détermination des paramètres "optimaux" (au sens des moindres carrés) et se ramène donc à la résolution d'un système d'équations linéaires. Il s'agit là d'une propriété très intéressante, liée au fait que le modèle lui-même est linéaire. On parle d'ajustement ou de régression linéaire. Dans le cas général, la détermination du minimum du est un problème plus compliqué, et généralement coûteux en temps de calcul.

La valeur des paramètres et dépend des mesures réalisées. Comme ces mesures sont entachées d'erreur, on conçoit bien que si l'on répète fois les mesures de calibration, et que l'on réalise a l'issue de chaque série l'ajustement décrit plus haut, on obtiendra valeurs numériquement différentes de et . Les parametres de l'ajustement peuvent donc etre consideres comme des variables aléatoires, dont la loi est fonction du modele ajuste et de la loi des .

On montre que la dispersion qui affecte les valeurs de et depend du nombre de points de mesure, , et de la dispersion qui affecte les mesures (moins les mesures sont precise, plus et fluctueront). Par ailleurs, et ne sont generalement pas des variables indépendantes. Elles sont généralement corrélées, et leur corrélation dépend du modèle ajusté (nous avons supposé les indépendants).

Ajustement de modèles non-linéaires

Ajustement sous contraintes

Formalisme général : ajustement de modèles implicites

Interprétation statistique

Le critère du chi2

Optimalité de la méthode des moindres carrés

Il faut se garder de penser la méthode optimale quels que soient les cas de figure. Ainsi par exemple appliquer une méthode des moindres carrés sur une courbe en log-log (chaque axe porte le logarithme de la valeur représentée) peut ne pas présenter grand sens. De même, selon que l'on a à sa disposition un ampèremètre ou un wattmètre, la mesure de grandeur de ce qui passe dans un réseau de résistance sera soit :

  • L'intensité (i)
  • La puissance (Ri²)

Il va de soi qu'une méthode des moindres carrés sur la première de ces valeurs n'a pas de raison de donner le même résultat sur les secondes. Il faut donc bien s'interroger sur la signification de ce "carré d'erreur" que l'on cherche à minimiser, et si besoin effectuer au préalable les changements de variable adéquats.

Ce serait également une erreur que d'appliquer une méthode de moindre carrés à une classification par rang (voir Loi de Zipf).

En revanche, là où une distribution gaussienne est présumée (ou choisie pour des raison d'entropie maximale en cas de méthode bayésienne), son choix peut souvent se justifier, et on le démontre même optimal si la relation entre les deux variables est bien linéaire.

Robustesse

Sensibilité aux points aberrants

Techniques de robustification

Modèle:Lien AdQ