Plan d'expérience

Plan d'expérience

On nomme plan d'expérience la suite ordonnée d'essais d'une expérimentation, chacune permettant d'acquérir de nouvelles connaissances en contrôlant un ou plusieurs paramètres d'entrée pour obtenir des résultats validant un modèle avec une bonne économie (nombre d'essais le plus faible possible, par exemple).

Un exemple classique est le « plan en étoile » où en partant d'un jeu de valeurs choisi pour les paramètres d'une expérience centrale, on complète celle-ci par des expériences où chaque fois un seul des facteurs varie « toutes choses égales par ailleurs ».

Un type de plan plus efficace est le « plan factoriel » consistant à choisir des valeurs pour chacun des facteurs en variant simultanément tous les facteurs (de façon exhaustive ou non). Le nombre d'essais peut alors devenir très grand (explosion combinatoire).

Cet article comporte des exemples illustrant la notion de plan d'expérience et expose des cas à la fois simples et fréquents.

Sommaire

Position du problème

Supposons que nous désirions savoir si la proportion de boules noires d'une urne est supérieure à 5%, l'urne contenant 1000 boules. Nous partons avec l'idée d'en tirer 100 dans l'espoir d'avoir une bonne approximation de la proportion.

  • Si au cours du tirage, nous ramenons 51 boules noires, celui-ci peut être arrêté immédiatement : le poursuivre n'aurait pas de sens, puisqu'avec 51 boules noires sur 1000 une proportion supérieure à 5% est maintenant certaine.
  • On peut raffiner encore en remarquant que la probabilité de tirer par exemple 5 boules noires dans les 5 premiers tirages ramène à 0,3 x 10-6 la probabilité que la proportion de boules noires soit inférieure à 5%.
  • Dans la pratique, le calcul permet d'établir des règles strictes indiquant en fonction des résultats à quel moment le tirage doit s'arrêter - avec décision prise dans un sens ou dans l'autre - ou s'il doit être poursuivi.

Un plan d'expérience permet donc de réduire le nombre d'essais à ce qui est strictement nécessaire pour prendre une décision, ce qui peut sauver du temps, de l'argent et des vies.

C'est un plan d'expérience de ce type qui a permis d'arrêter en cours de route une expérience visant à déterminer si l'aspirine avait un effet de prévention sur les crises cardiaques, les résultats établissant sans ambiguïté que c'était le cas (réduction de 25% des risques). Continuer l'expérimentation serait revenu dans ces conditions à priver jusqu'à la date initialement prévue les malades du lot-témoin d'accès à l'aspirine, ce qui aurait pu coûter la vie à certains d'entre eux.

Voir aussi l'article Inférence bayésienne et le problème dit du bandit manchot.

En sciences appliquées (plans expérimentaux)

Il existe de nombreux processus qu'on sait dépendre d'un grand nombre de paramètres externes (on parle de facteurs) mais sans que l'on en ait des modèles analytiques.

Lorsque l'on est intéressé de connaître la dépendance d'une variable de sortie F d'un tel processus, on se trouve confronté à plusieurs difficultés :

  • Quels sont les facteurs les plus influents ?
  • Existe-t-il des interactions entre les facteurs (corrélations) ?
  • Peut-on linéariser le processus en fonction de ces facteurs et le modèle ainsi obtenu est-il prédictif ?
  • Comment minimiser le nombre de points de mesure du processus pour obtenir le maximum d'informations ?
  • Existe-t-il des biais dans les résultats des mesures ?

La méthode du plan d'expérience répond à ces questions et peut ainsi être appliquée dans de nombreux processus qui vont par exemple des essais cliniques à l'évaluation de la qualité des processus industriels les plus complexes.

On peut ainsi pour l'industrie poser cette nouvelle définition : Un plan d'expériences est une suite d’essais rigoureusement organisés, afin de déterminer avec un minimum d’essais et un maximum de précision, l’influence respectives des différents paramètres de conception ou de fabrication d’un produit, afin d’en optimiser les performances.

En sciences humaines

La notation de Rouanet et Lépine

Dans le courant des années 1960, les scientifiques, au premier rang desquels Henry Rouanet (1931-2008), cherchent à formaliser la notion de plan expérimental en utilisant une « approche algébrique » qui n'est pas sans rappeler le mouvement Bourbaki qu'ont connu les mathématiques françaises à la fin des années 1930. Formé aux statistiques et à l'analyse des données, Rouanet, dans une collaboration avec le psychologue Dominique Lépine[1], propose un système de notation dit « ensembliste » permettant de « se dégager des ambiguïtés du langage naturel » et qui soit directement traduisible dans le langage machine des ordinateurs de l'époque[2]. Ces travaux théoriques donneront ainsi lieu au développement du logiciel VAR3 qui permettent notamment de calculer des tests statistiques associés au plans expérimentaux et qui a connu un grand succès dans les laboratoire de psychologie.

Bien que, depuis lors, couramment enseignée dans les facultés françaises de psychologie pour son intérêt pédagogique, la notation de Rouanet et Lépine se rencontre extrêmement rarement dans les publications scientifiques, y compris en psychologie expérimentale, l'usage étant en général de décrire le plan expérimental « en toutes lettres ». Dans les autres disciplines des sciences humaines, où l'approche expérimentale est souvent moins fréquente, cette notation n'est pas davantage usitée.

Les symboles utilisés
  • <...> = Emboîté, c'est-à-dire qu'il y a un groupe par modalité !
  • * ... = Croisé, c'est-à-dire qu'il n'y a qu'un seul groupe pour toutes les modalités.
  • S = Signifie sujet.
  • S10<M2> = Signifie qu'il y a 20 sujets (car 10 sujets x 2 modalités)
  • S10*M2 = Signifie qu'il y a 10 sujets
  • M2 = M est le symbole d'une VI (Variable Indépendante), et 2 en indice, indique le nombre de modalités.
Plan monofactoriel

On peut avoir deux types de plan monofactoriel :

Méthode 1 Méthode 2
Type de plan Emboîté Croisé
Type de groupe Groupes indépendants Groupes appariés
Formule S10<M2> S10*M2
Nombre de données 20 données pour 20 sujets
10 sujets pour M1 et 10 pour M2
20 données pour 10 sujets
les 10 sujets passent M1 et M2
Problème Il est difficile d'avoir deux groupes réellement équivalents Il y a des interférences d'une activité à l'autre
Plan multifactoriel

On parle de plan multifactoriel à partir de deux variables indépendantes testées simultanément. On peut avoir trois types de plan multifactoriel :

Méthode 1 Méthode 2 Méthode 3
Type de plan Emboîté complet Croisé complet Mixte ou quasi complet
Type de groupe Un groupe de sujets par cellule du plan Chaque sujet rencontre toutes les conditions expérimentales On a deux groupes emboîtés, qui passent chacun toutes les conditions
Formule S10<M2*R3> S10*M2*R3 S10<M2>*R3
Nombre de données 60 données pour 60 sujets 60 données pour 10 sujets 60 données pour 20 sujets
Problème Il est difficile d'avoir des groupes réellement équivalents et beaucoup de sujets sont nécessaires Peut être fatiguant pour les sujets, effets d'une condition sur l'autre Avantages et inconvénients de l'un ou l'autre type en fonction de la variable considérée

Limites des plans expérimentaux exhaustifs

Supposons que l'on soit en présence d'un processus qui dépende de 3 facteurs A, B et C qui ont chacun leur domaine de définition (discret) {ai | i = 1,..,l} , {bj | j = 1,...,m} , {ck | k = 1,...,n}.

Une approche systématique consisterait à effectuer toutes les expériences possibles du processus en faisant varier chacun des paramètres dans son domaine de définition:

Expérience 1: {a1,b1,c1} \Longrightarrow Résultat F1

Expérience 2:{a2,b1,c1} \Longrightarrow Résultat F2

Expérience 3:{a3,b1,c1} \Longrightarrow Résultat F3

\vdots

Expérience l\cdotm\cdotn:{al,bm,cn} \Longrightarrow Résultat F_{l\cdot m\cdot n}

Le nombre d'expériences nécessaires, qui est égal au produit l\cdotm\cdotn, peut être tout à fait considérable et hors de portée pour des raisons de coût et/ou de temps.

Exemple

Supposons que l'on souhaite caractériser un processus électrolytique par la mesure du courant entre les électrodes.

Pour une solution d'électrolyte donnée, un modèle grossier laisse supposer que ce courant va dépendre de trois facteurs principaux: (1) la dilution de la solution C, comprise entre 10% et 90%, (2) la température de la solution T, comprise entre 50 °C et 100 °C, et (3) la nature des électrodes utilisées (étain, or et en platine). Dans ces conditions, en prenant des pas de 10% pour la concentration et de 10 °C pour la température, le plan expérimental exhaustif sera constitué de 9x6x3, soit 162 expériences indépendantes qu'il faudra faire dans des conditions par ailleurs identiques.

En supposant que chaque expérience prend 1 heure (en comptant le temps de préparation), l'étude de ce simple processus ne demanderait pas moins de 5 semaines de travail à plein temps (35h par semaine). De plus, des expériences étalées sur un aussi grand laps de temps pourrait faire intervenir des facteurs non-connus mais variant sur la durée de cette étude et pouvant fausser les résultats.

On comprend aisément que les points relevés ci-dessus deviennent dramatiques dès que l'on a affaire à des processus un peu plus complexes et le coût expérimental d'une étude exhaustive devient vite prohibitif, voire inapplicable. C'est un problème courant dans les processus industriels qui exigent une reproductibilité et un contrôle qualité total.

La manière correcte d'aborder un plan d'expérience optimal est de procéder d'une manière tout à fait analogue au principe de la droite de régression en supposant que l'on a des dépendances linéaires (ou tout au plus quadratiques) du processus dans chacune de ces variables ainsi que des interactions entre les variables. On se basera le plus souvent sur des hypothèses simples et/ou des expériences limites pour se donner une idée de l'existence ou non de dépendances croisées.

Reprenons le processus décrit plus haut en supposant que en plus de T et C, on définisse m comme une grandeur physique qui caractérise la matière de l'électrode (par exemple son poids moléculaire ou son électrovalence, etc.):

On souhaite le décrire par une formule simplifiée du type:

F(T,C,m)=

b1\cdotT2 + b2\cdotC2 + b3\cdotm2 + b4\cdotT + b5\cdotC + b6\cdotm + b7\cdotT\cdotC + b8\cdotT\cdotm + b9\cdotC\cdotm + b10\cdotT\cdotC\cdotm + b11\cdotT2\cdotC + b12\cdotT2\cdotm + b13\cdotC2\cdotT + b14\cdotC2\cdotm + b15\cdotT\cdotm2 + b16\cdotC\cdotm2

Pour simplifier, on supposera raisonnablement que les termes en T2\cdotC , T2\cdotm , C2\cdotT , C2\cdotm , T\cdotm2 et C\cdotm2 sont négligeables par rapport aux termes du premier ordre, ce qui revient à dire que les coefficients b11 , b12, b13 , b14 , b15 et b16 sont nuls (en général, le terme en T\cdotC\cdotm est aussi négligeable).

Il reste alors 10 variables b1 , .. , b10 à déterminer pour avoir une connaissance analytique du processus dans les intervalles spécifiés.

On « choisit » 10 points dans l'espace (T, C , m), pour lesquels on effectue l'expérience, obtenant ainsi les valeurs de {Fi} pour chacun de ces points. On veillera évidemment à ce que tous les autres paramètres de l'expérience restent constants.

NB : on travaille de préférence avec des variables réduites, c’est-à-dire des variables T, C et m qui sont sans dimensions et normalisées à 1 sur leur intervalle de définition

Il en résulte le système de 10 équations à 10 inconnues:

Fi = ai1\cdotb1 + ai2\cdotb2 + ai3\cdot b3 + ai4\cdotb4 + ai5\cdotb5 + ai6\cdotb6 + ai7\cdotb7 + ai8\cdotb8 + ai9\cdotb9 + ai10\cdotb10

avec i = 1,..,10.

Les aij sont obtenus simplement en remplaçant T,C et m par leur valeurs aux points où l'on a fait les expériences.

En écriture matricielle:

\begin{bmatrix} F_1 \\ \vdots \\ F_{10} \end{bmatrix} = \begin{bmatrix} a_{1,1} & \cdots & a_{1,10} \\ \vdots & \ddots & \vdots \\ a_{10,1} & \cdots & a_{10,10} \end{bmatrix}\cdot\begin{bmatrix} b_1 \\ \vdots \\ b_{10}\end{bmatrix}

Pour résoudre ce système, il faut inverser la matrice \begin{bmatrix} a_{ij}\end{bmatrix}:

\begin{bmatrix} b_1 \\ \vdots \\ b_{10} \end{bmatrix} = {\begin{bmatrix} a_{1,1} & \cdots & a_{1,10} \\ \vdots & \ddots & \vdots \\ a_{10,1} & \cdots & a_{10,10} \end{bmatrix}}^{-1}\cdot\begin{bmatrix} F_1 \\ \vdots \\ F_{10}\end{bmatrix}

La théorie des plans expérimentaux permet à partir de modèles spécifiques plus ou moins complexes de déterminer précisément en quels points les mesures doivent être faites.

Les plans factoriels

Parmi les différents plans expérimentaux, les plans factoriels sont courants car ils sont les plus simples à mettre en œuvre et ils permettent de mettre en évidence très rapidement l'existence d'interactions entre les facteurs.

L'hypothèse de base est d'assigner à chaque facteur (normalisé) sa valeur la plus basse ( − 1) et sa valeur la plus haute ( + 1). Ainsi, pour k facteurs, on se retrouve avec un ensemble de 2k valeurs possibles.

Sans entrer dans les détails, la matrice d'expérience \begin{bmatrix} a_{ij}\end{bmatrix} possède alors des propriétés intéressantes (on a par exemple: aT\cdot a = k\cdot1) qui sont largement exploitées par les logiciels qui établissent des plans expérimentaux. En particulier, l'ajout d'expériences supplémentaires ainsi que des algorithmes de randomisation efficace du plan d'expérience initial permettent de mettre en évidence des biais systématiques et de les supprimer ou alors de mettre en évidence l'influence d'une variable cachée dont il faut tenir compte.

Pour reprendre l'exemple ci-dessus, on se retrouve avec un plan à 12 expériences (2 températures extrêmes, 2 concentrations extrêmes et 3 paires d'électrodes).

Travaillons avec la température et la concentration normalisée:

t = \frac {T-75} {25}

c = \frac {C-50} {40}

On cherche maintenant uniquement des dépendances linéaires en t et en c, c'est-à-dire une relation du type:

IX(t,c) = b1t+ b2c+ b3tc pour X=1,2 ou 3 selon le type d'électrode.

En effectuant les mesures du courant aux 4 points (50 °C,10%) , (50 °C,90%) , (100 °C,10%), (100 °C,90%) correspondant aux points ( − 1, − 1),( − 1, + 1), ( + 1, − 1) et ( + 1, + 1) dans l'espace des facteurs réduits, on a, pour chaque type d'électrode, on est ramené à un plan factoriel 22

\begin{bmatrix} I_1 \\ I_2 \\ I_3 \\ I_4\end{bmatrix} = \begin{bmatrix} -1  & -1 & +1 \\ -1 & +1 & -1 \\ +1 & -1 & -1 \\ +1 & +1 & +1\end{bmatrix}\cdot\begin{bmatrix} b_1 \\ b_2 \\ b_3\end{bmatrix}

On vérifie effectivement que aT\cdot a = k\cdot1, et on obtient la résolution du système:

\Longrightarrow \begin{bmatrix} b_1 \\ b_2 \\ b_3\end{bmatrix} = \frac {1} {4} \begin{bmatrix} -1  & -1 & +1 & +1 \\ -1 & +1 & -1 & +1 \\ +1 & -1 & -1 & +1\end{bmatrix}\cdot\begin{bmatrix} I_1 \\ I_2 \\ I_3 \\ I_4 \end{bmatrix}

Soit:

b1 = \frac {1} {4} (-I1 - I2 + I3 + I4)

b2 = \frac {1} {4} (-I1 + I2 - I3 + I4)

b3 = \frac {1} {4} (I1 - I2 - I3 + I4)

Ainsi, moyennant quelques précautions, on a ramené une étude d'un processus non analytique constitué de 162 expériences distinctes à un processus d'une douzaine d'expériences, qui donne des résultats intéressants sur les intervalles considérés, en particulier sur l'existence et l'amplitude des interactions entre les différents facteurs.

Notes et références

  1. Hommage à Dominique Lépine, L'année psychologique (2000), Vol. 100, Num. 2, pp. 377-381
  2. H. Rouanet, D. Lépine. Structures linéaires et analyse des comparaisons. Mathématiques et Sciences Humaines, 56 (1977), p. 5-46.

Voir aussi

Bibliographie

  • Les plans d'expériences, un outil indispensable à l'expérimentateur, Richard Linder. Presses de l'École Nationale des Ponts et Chaussées. 320 p., 2005 ISBN 2-85978-402-0.
  • Introduction aux plans d'expérience, Jacques Goupy et Lee Creighton, Dunod/L'usine nouvelle, 2006, ISBN 2-10-049744-8
  • Pratique industrielle des plans d'expériences, Jacques et Philippe ALEXIS, AFNOR, 1999, ISBN 2-12-465038-6
  • Les plans d'expériences - Méthode Taguchi, Pierre Souvay, A Savoir, AFNOR, 1995, ISBN 2-12-475028-3

Articles connexes

Liens externes

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Plan d'expérience de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Plan d'experience — Plan d expérience On nomme plan d expérience l organisation d une expérience dont le déroulement lui même sera conditionné par les résultats obtenus en cours de route. C est une façon de procéder indispensable chaque fois que les essais et… …   Wikipédia en Français

  • Plan d'expérience — ● Plan d expérience schéma présidant, dans une expérimentation, au recueil des données et tendant à permettre une analyse statistique de ces données …   Encyclopédie Universelle

  • Expérience de vie — Expérience L expérience est en partie dérivée de l observation et la compagnie de ceux qui sont déjà sages Pour les articles homonymes, voir Expé …   Wikipédia en Français

  • plan — 1. plan, plane [ plɑ̃, plan ] adj. • 1520; lat. planus 1 ♦ Sans aspérité ni inégalité, qui ne présente de courbure en aucun de ses points (surface). ⇒ 1. plat, uni; 2. plan, planéité. Rendre plan : aplanir, niveler. Miroir plan. On définit « la… …   Encyclopédie Universelle

  • Experience scientifique — Méthode expérimentale Pour les articles homonymes, voir Expérience (homonymie). La Science et les Sciences Généralités Connaissance · Théorie · Savoir Classification des scienc …   Wikipédia en Français

  • Expérience — Pour les articles homonymes, voir Expérience (homonymie). D un point de vue très théorique, une expérience est un engagement dans une situation de mise à l épreuve d un élément d ordre spéculatif, souvent appelé hypothèse lorsqu elle s inscrit… …   Wikipédia en Français

  • Expérience (science) — Méthode expérimentale Pour les articles homonymes, voir Expérience (homonymie). La Science et les Sciences Généralités Connaissance · Théorie · Savoir Classification des scienc …   Wikipédia en Français

  • Expérience Scientifique — Méthode expérimentale Pour les articles homonymes, voir Expérience (homonymie). La Science et les Sciences Généralités Connaissance · Théorie · Savoir Classification des scienc …   Wikipédia en Français

  • Expérience cruciale — Méthode expérimentale Pour les articles homonymes, voir Expérience (homonymie). La Science et les Sciences Généralités Connaissance · Théorie · Savoir Classification des scienc …   Wikipédia en Français

  • Expérience scientifique — Méthode expérimentale Pour les articles homonymes, voir Expérience (homonymie). La Science et les Sciences Généralités Connaissance · Théorie · Savoir Classification des scienc …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”