Bonjour, nous sommes le 02/10/2023 et il est 04 h 48.





 

 

1 | P a g e

 
UNIVERSITE DE LUBUMBASHI

 

FACULTE POLYTECHNIQUE

 

DEPARTEMENT DE CHIMIE INDUSTRIELLE

 

 

 

 

 

 

 

 

 

 

ETUDES CINETIQUES ET INFERENCES STATISTQUES DES COLLECTEURS AERO 6493 ET PNBX A LA FLOTTATION DES MINERAIS OXYDES CUPRO-COBALTIFERES

 

 

 

« Cas de rejets de la laverie de Luiswishi »

 

 

 

 

 

Par MALUNDAMA MONIZE Souley man

 

 

Travail présenté et défendu en vue de lobtention du grade de

 

bachelier en chimie industrielle.

 

 

Directeur : Professeur KANDA NTUMBA

 

 

Encadreurs : Ass. KATUFU MANIKAY et C.C. KABOKO

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Année Académique  2017-2018


RESUME

 

Ce travail présente les résultats d’une étude de flottation menée sur les rejets de la laverie de Luiswishi. Ces rejets présentent un certain danger qui est à la base de la dégradation des milieux environnants les plus proches suite à la migration des éléments traces métalliques tels que le cobalt, le cuivre, le zinc. Léchantillon de ces rejets titrant en moyenne 1,65% Cu et 1,2% Co a été réceptionné au laboratoire de la faculté polytechnique et y est stocké depuis mai 2017.

 

L’objectif poursuivi est de déterminer les comportements cinétiques ainsi que  les conditions opératoires optimales et minimales d’utilisation des collecteurs Normal Butyl Xanthate de Potassium (PNBX) et Alkyl hydroxamate (AERO 6493) dans le retraitement de ces rejets.

 

Pour atteindre l’objectif fixé, l’approche méthodologique adoptée a englobé trois études. La première consistant à trois séries dessais de flottation afin dévaluer les performances métallurgiques de ces collecteurs. La seconde a é consacrée aux études cinétique et statistique. Enfin, une dernière focalisée sur létude du comportement global de ces collecteurs après une inférence statistique des données de flottation.

 

La première étude a révé qu’aux doses de 300 g/t de PNBX avec une sulfuration à 3000 g/t de NaHS, le concentré obtenu a titré en tête 4,71 % de Cu et un concentré ébauc à 3,99 % de Cu avec des rendements de cupérations respectifs de 71,89 % et 88,89 %. Tandis qu’aux doses de 250 g/t d’AERO 6493 sans sulfuration, le concentré obtenu a titré en tête 3,94% et à l’ébauchage 2,91% avec des rendements de récupération respectifs de 74,96% et 88,97%. Les conditions opératoires optimales communes étaient donc 250 g/t de la mixture et du silicate de sodium et 100 g/t du moussant.

 

La deuxième étude a révé que la dose de 300 g/t de PNBX a conduit à un rendement maximal de cupération Cuivre de 93,21 % à un temps probable de flottation de 11,27 minutes pour une constante cinétique de 2,16 min-1. Tandis que la dose de 250 g/t dAERO 6493 a produit un rendement limite de cupération de cuivre de 92,49% Cu à un temps probable de flottation de

11,62 minutes pour une constante cinétique de 2,62 min-1.

 

Enfin, une dernière étude qui a démont que les doses de 200 g/t  et 250 g/t sont minimales

 

respectivement pour le PNBX et lAERO 6493, avec des rendements limites de 88,25% et

 

88,42% Cu, et les temps limites de flottation de 11,47 et 11,22 minutes, respectivement. En outre, l’AERO 6493 présente une constante cinétique de 2,367 min-1 contre 2,438 min-1 pour le PNBX. Le calcul et lestimation du gain financier renforceraient l’évaluation de ces résultats.


TABLE DES MATIERES

 

 

 

 

RESUME..................................................................................................................................... I TABLE DES MATIERES ........................................................................................................ II LISTE DES ABREVIATIONS ................................................................................................ IV LISTE DES FIGURES .............................................................................................................. V LISTE DES TABLEAUX ........................................................................................................ VI REMERCIEMMENT ............................................................................................................... IX INTRODUCTION GENERALE................................................................................................ 1

CHAPITRE I : RAPPEL DES NOTIONS IMPORTANTES SUR LA METHODE STATISTIQUE .......................................................................................................................... 3

 

I.1. Introduction .......................................................................................................................... 3

 

I.2. Terminologies fondamentales .............................................................................................. 3

 

I.3. La démarche statistique........................................................................................................ 5

 

I.3.1. La statistique descriptive univariée ........................................................................... 5

 

I.3.2. La statistique descriptive bivariée ............................................................................. 8

 

I.3.3. La statistique inrentielle ....................................................................................... 12

 

I.4. Méthode statistique d’ajustement ...................................................................................... 16

 

CHAPITRE II : RAPPELS DES NOTIONS IMPORTANTES SUR LA FLOTATION ET LA CINETIQUE DE FLOTTATION ............................................................................................ 18

 

II.1. INTRODUCTION ............................................................................................................ 18

 

II.2. BREF RAPPEL SUR LA FLOTTATION A LA MOUSSE ............................................ 18 a. Définition et principe.................................................................................................... 18 b. Paramètres importants de la flottation.......................................................................... 19 c. Critères dévaluation des résultats de flottation ........................................................... 20 d. Réactifs de flottation .................................................................................................... 22 e. Mécanismes de sulfuration ........................................................................................ 25 fStragie dajout des réactifs...................................................................................... 25

II.3. CINETIQUE ET MODELES MATHEMATIQUES ....................................................... 26

 

II.3.1. Introduction ........................................................................................................... 26

 

II.3.2. Modèles cinétiques de flottation ............................................................................ 27

 

II.4. SYNTHESE DE TRAVAUX ANTERIEURS SUR LE RETRAITEMENT DES REJETS

DE LA LAVERIE DE LUISWISHI, LE PNBX ET LAERO 6493 ....................................... 30

 

CHAPPITRE III : MATERIELS ET METHODES ................................................................. 35

 

III.1. Origine et préparation de l’échantillon............................................................................ 35


III.2. Caractérisation de l’échantillon ....................................................................................... 35

 

III.3. Réactifs de flottation ....................................................................................................... 40

 

III.3.1. Réactifs utilisés .................................................................................................... 40

 

III.3.2. Matériels utilisés .................................................................................................. 40

 

III.3.3. Procédure expérimentale ...................................................................................... 40

 

III.4. Essais de flottation .......................................................................................................... 42

 

III.4.1. Matériels utilisés .................................................................................................. 42

 

III.4.2. Procédure expérimentale ...................................................................................... 42

 

III.4.3. Conditions opératoires.......................................................................................... 44

 

CHAPITRE IV : PRESENTATION ET ANALYSE DES RESULTATS .............................. 45

 

IV.1. INTRODUCTION .......................................................................................................... 45

 

IV.2. ESSAIS DE FLOTTATION ........................................................................................... 45

 

IV.2.1. Influence des doses du PNBX .............................................................................. 45

 

IV.2.2. Influence des doses de l’AERO 6493 .................................................................. 48

 

IV.2.3. Comparaison des meilleurs sultats .................................................................... 50

 

IV.3. ETUDE DE LA CINETIQUE DE FLOTTATION ........................................................ 52

 

IV.3.1. Etude cinétique du collecteur PNBX ................................................................... 52

 

IV.3.2. Etude cinétique du collecteur AERO 6493 .......................................................... 63

 

IV.4. ESSAIS DE CONFIRMATION ..................................................................................... 76

 

IV.5. ETUDE DU COMPORTEMENT GLOBAL DES COLLECTEURS PNBX ET LAERO

6493 : INFERENCE STATISTIQUE ...................................................................................... 77

 

IV.5.1. Etude de la vitesse moyenne de collection à l’aide du PNBX ............................. 77

 

IV.5.2. Etude de la vitesse moyenne de collection à l’aide de lAERO 6493.................. 82

 

IV.6. Conclusion partielle ........................................................................................................ 86

 

CONCLUSION GENERALE .................................................................................................. 87

 

BIBLIOGRAPHIE ................................................................................................................... 89

ANNEXES .................................................................................................................................. I ANNEXE I : Les résultats détaillés de la flottation à laide des collecteurs PNBX (essais 1 à 5)

et lAERO 6493 (essais 6 à 10) ................................................................................................. II

 

ANNEXE II : Les résultats métallurgiques des essais de confirmation de la méthode statistique pour les deux collecteurs à la dose de 300 g/t ....................................................................... VIII

 

ANNEXE III : La Table de la loi T de STUDENT ................................................................... X


LISTE DES ABREVIATIONS

 

 

 

-     µm : micromètre.

 

-     A : masse du minerai à flotter ;

 

-     a : teneur de lélément utile dans le minerai avant concentration ;

 

-     AERO 6493 : Alkyl hydroxamate

 

-     C : masse du concentré ;

 

-     c : teneur du métal dans le concentré ;

 

-     Co : Cobalt ;

 

-     Cu : Cuivre ;

 

-     KAX : Amyl Xanthate de Potassium ;

 

-     kmax : constante cinétique maximale ;

 

-     kmoy : constante cinétique moyenne ;

 

-     min : minute ;

 

-     NaHS : Sulfhydrate de sodium ;

 

-     PNBX : Normal Butyl Xanthate de Potassium ;

 

-     Rdt (%) ou ɳ : rendement de récupération ;

 

-     Rmax : rendement maximal ;

 

-     Rmoy : rendement moyen ;

 

-     t- : temps infini ou temps d’équilibre ;

 

-     tmax : la limite pratique du temps de flottation ;

 

-     tmoy : le temps moyen de flottation ;

-      : Le rendement pondéral de concentration.


LISTE DES FIGURES

 

 

 

Figure I-1 : Test de T Student .................................................................................................. 15

 

Figure II-1 : Mécanisme de flottation (PROULX, 2000) ......................................................... 19

 

Figure II-2 : Courbe de sélectivité (KALUME, 2016) ............................................................. 21

 

Figure II-3 : Mode daction dun collecteur à la surface du minéral (Djamel, 2014) .............. 22

 

Figure II-4 : Classification générale des collecteurs de flottation (KATUFU, 2017) .............. 23

 

Figure II-5: Analyses chimiques de l’échantillon .................................................................... 30

 

Figure III-1 : La courbe des analyses granulométriques de l’échantillon ................................ 37

 

Figure III-2 : Courbe de broyabilité pendant différents temps................................................. 38

 

Figure III-3 : Histogramme donnant les répartitions du Cu et du Co de l’échantillon broyé pendant 25 min23sec. ............................................................................................................... 39

Figure III-4 : Schéma de flottation en ébauchage simple......................................................... 43

 

Figure IV-1 : Evaluation du rendement de cuivre en fonction de la dose du PNBX ............... 46

 

Figure IV-2 : Courbes de sélectivité du cuivre sur l’influence des doses du PNBX ............... 47

 

Figure IV-3 : Evaluation du rendement du cuivre en fonction de la dose de l’AERO ............ 49

 

Figure IV-4 : Courbes de sélectivité du cuivre sur l’influence des doses de lAERO 6493 .... 50

 

Figure IV-5 : Comparaison en fonction du rendement des meilleurs résultats de flottation de deux collecteurs ........................................................................................................................ 51

Figure IV-6 : Courbes de sélectivité de cuivre pour les meilleurs résultats des deux séries d’essai

 

.................................................................................................................................................. 51

 

Figure IV-7 : Droite de régression pour 300g/t de PNBX ....................................................... 54

 

Figure IV-8 : droite de gression pour 250 g/t de PNBX ....................................................... 56

 

Figure IV-9 : droite de gression rendement-temps pour la dose de 200 g/t de PNBX ......... 58

 

Figure IV-11 : Courbe de gression de la dose de 100 g/t de PNBX ..................................... 62

 

Figure IV-12 : Courbe de gression rendement temps pour 300 g/t de l’AERO.................. 65

 

Figure IV-13 : Courbe de gression pour 250 g/t de l’AERO 6493 ....................................... 67

 

Figure IV-14 : Courbe de gression rendement-temps pour 200 g/t de l’AERO ................... 70

 

Figure IV-15 : Droite de gression rendement-temps pour 150 g/t d’AERO6493 ................. 72

 

Figure IV-16 : Courbe de gression pour la dose de 100 g/t de lAERO ............................... 74

 

Figure IV-19 : Droite de gression des rendements moyens du PNBX ................................. 81

 

Figure IV-20: La droite de gression des rendements pour lAERO 6493............................. 85


LISTE DES TABLEAUX

 

 

 

 

 

Tableau II-1 : Quelques réactifs activants ................................................................................ 24

 

Tableau II-2 : La variation de la dose de NaHS et du KAX à l’ébauchage avec un rapport de

 

1/10 d’alimentation .................................................................................................................. 31

 

Tableau II-3 : Estimation du rendement limite ........................................................................ 32

 

Tableau III-1 : Analyse Granulométrique de l’échantillon ...................................................... 36

 

Tableau III-2 : Résultats du test de broyabilité pour différents temps ..................................... 38

 

Tableau III-3 : Analyse granulo-chimique du minerai broyé pendant 25min 23sec ................ 39

 

Tableau III-4 : Domaine de variation de différentes doses de actifs..................................... 41

 

Tableau III-5 : Temps de conditionnement et distribution des réactifs pendant les essais ...... 43

 

Tableau IV-1 : Synthèse des résultats des essais de flottation sur l’influence des doses du PNBX

 

.................................................................................................................................................. 46

 

Tableau IV-2 : Synthèse des résultats des essais de flottation sur l’influence des doses de l’AERO 6493............................................................................................................................ 48

Tableau IV-3 : Synthèse des meilleurs résultats des essais de flottation pour les deux collecteurs

 

.................................................................................................................................................. 50

 

Tableau IV-4 : Constante et rendement du modèle de Klimpel pour 300 g/t de PNBX .......... 53

 

Tableau IV-5 : Les statistiques de gression pour 300 g/t de PNBX...................................... 53

 

Tableau IV-6 : Analyse de variance pour la droite de gression de la dose de 300 g/t de PNBX

 

.................................................................................................................................................. 54

 

Tableau IV-7 : Constante et rendement du modèle de Klimpel pour 250 g/t de PNBX .......... 55

 

Tableau IV-8 : Les analyses de la droite de gression pour la dose de 250 g/t de PNBX ...... 55

 

Tableau IV-9 : Les analyses de la variance de la droite de régression pour 250 g/t de PNBX 56

 

Tableau IV-10 : Constante et rendement du modèle de Klimpel pour 200 g/t de PNBX ........ 57

 

Tableau IV-11 : analyse de la droite de gression pour la dose de 200 g/t de PNBX ............ 57

 

Tableau IV-12 : Analyses de la variance de la droite de régression pour la dose de 200 g/t de

 

PNBX ....................................................................................................................................... 58

 

Tableau IV-13 : Constante et rendement du modèle de Klimpel pour 150 g/t de PNBX ........ 59

 

Tableau IV-14 : Les statistiques de gression pour la dose de 150 g/t de PNBX................... 59

 

Tableau IV-15 : Analyses de la variance de la droite de régression pour la dose de 150 g/t de

 

PNBX ....................................................................................................................................... 60


Figure IV-10 : Courbe de gression rendement-temps pour 150 g/t de PNBX ...................... 60

 

Tableau IV-16 : Constante et rendement du modèle de Klimpel pour 100 g/t ........................ 61

 

Tableau IV-17 : les statistiques de la régression pour la dose de 100 g/t de PNBX ................ 61

 

Tableau IV-18 : Analyse de la variance pour la dose de 100 g/t de PNBX ............................. 62

 

Tableau IV-19 : Comparaison de la constante cinétique, du rendement limite et du temps limite de flottation selon les doses du PNBX ..................................................................................... 63

Tableau IV-20 : Constante et rendement du modèle de Klimpel pour 300 g/t d’AERO 6493 64

 

Tableau IV-21 : Statistiques de régression pour 300 g/t d’AERO 6493 .................................. 64

 

Tableau IV-22 : Analyse de la variance pour la dose de 300 g/t de l’AERO .......................... 65

 

Tableau IV-23 : Constante et rendement du modèle de Klimpel pour 250 g/t d’AERO 6493 66

 

Tableau IV-24 : Les statistiques de gression pour la dose de 250 g/t de lAERO. ............... 66

 

Tableau IV-25 : Analyse de la variance pour la dose de 250 g/t de l’AERO .......................... 67

 

Tableau IV-26: Constante et rendement du modèle de Klimpel pour 200 g/t d’AERO 6493 . 69

 

Tableau IV-27 : les statistiques de gression pour la dose de 200 g/t de l’AERO ................. 69

 

Tableau IV-28 : Analyse de la variance pour la dose de 200 g/t de l’AERO .......................... 70

 

Tableau IV-29: Constante et rendement du modèle de Klimpel pour 200 g/t d’AERO 6493 . 71

 

Tableau IV-30 : Les statistiques de gression pour la dose de 150 g/t de lAERO 6493 ....... 71

 

Tableau IV-31 : Analyse de la variance de la droite de gression pour 150 g/t de l’AERO 6493

 

.................................................................................................................................................. 72

 

Tableau IV-32 : Constante et rendement du modèle de Klimpel pour 100 g/t d’AERO 6493 73

 

Tableau IV-33 : Les statistiques de la régression pour 100 g/t d’AERO 6493 ........................ 73

 

Tableau IV-34 : Analyse de la variance pour la dose de 100 g/t de l’AERO 6493 ................. 74

 

Tableau IV-35 : Comparaison de la constante cinétique et du rendement limite selon les doses

 

de l’AERO ................................................................................................................................ 75

 

Tableau IV-36 : Résultats des essais de confirmation de l’étude statistique pour la dose de 300

 

g/t des collecteurs PNBX et lAERO 6493 .............................................................................. 76

 

Tableau IV-37 : Synthèse des résultats du rendement en fonction du temps pour le PNBX ... 77

 

Tableau IV-38 : Analyse globale des observations faites avec le PNBX ................................ 78

 

Tableau IV-39 : synthèse des résultats des rendements moyens en fonction du temps (PNBX)

 

.................................................................................................................................................. 79

 

Tableau IV-40 : analyse de la covariance des variables temps et rendement moyen .............. 79

 

Tableau IV-41 : Les statistiques de la régression des rendements moyens de PNBX ............. 80

 

Tableau IV-42 : Analyse de Variance et des paramètres de gression pour le PNBX ........... 81

 

Tableau IV-43 : Synthèse des résultats du rendement en fonction du temps pour l’AERO .... 82


Tableau IV-44 : Analyse globale des observations faites sur l’AERO 6493 ........................... 82

 

Tableau IV-45 : synthèse des résultats des rendements moyens en fonction du temps ........... 83

 

Tableau IV-46 : analyse de la covariance des données d’observation de lAERO 6493 ......... 83

 

Tableau IV-47: Les statistiques de la régression des rendements moyens pour lAERO 649384

 

Tableau IV-48: Les analyses de la variance et des paramètres de la gression pour l’AERO6493

 

.................................................................................................................................................. 85


REMERCIEMMENT

 

 

 

La réalisation de ce présent travail de fin  détude a connu le concours remarquable d’un bon

 

nombre de personnes à qui je témoigne sincèrement mes sentiments de profonde gratitude.

 

Je remercie vivement mon directeur, le Professeur Jean-Marie KANDA, pour ses conseils et sa disponibilité, malg les multiples responsabilités. Il a é un guide scientifique et un modèle permanent  sur le plan moral.

 

Nous sommes reconnaissants envers tout le corps professoral de notre facul en général et plus particulièrement nos professeurs, chefs de travaux, et assistants du département de chimie industrielle pour le bagage intellectuel reçu.

 

Je voudrais remercier de tout cœur l’assistant Serge KATUFU et Monsieur Patrick KABOKO pour leurs codirections dans la alisation de ce travail. Qu’ils trouvent en ces mots mes sentiments de profonde gratitude et de toute mon admiration et reconnaissance.

 

Spécial merci à toute la famille MALUNDAMA, cette famille qui ne cesse de croire en moi et en mes intentions.

 

Nous remercions anticipativement ceux qui porteront une attention soutenue à ce travail.


 

 

INTRODUCTION GENERALE

 

 

 

Aps un siècle d’exploitation minière en République démocratique du Congo et compte tenu de son potentiel minier actuel, la problématique générale du secteur minier congolais peut être définie comme devant être orientée d’une part, vers la caracrisation et la valorisation des rejets miniers et d’autre part vers la gestion optimale des ressources minérales primaires. Le défi de l’industrie minière congolaise est donc d’améliorer la productivité et de réduire les coûts liés à l’exploitation et à la prise en compte des questions environnementales. (KANDA, 2012)

 

Quand un nouveau minerai est testé, limpact potentiel du choix de actif sur les configurations du circuit nest souvent pas apprécié. Pendant les tests de faisabilité pliminaires, ce n’est pas inhabituel d’évaluer seulement un ou deux collecteurs. Lhypothèse est que ce test pourra fournir dinformations suffisantes pour concevoir le flow-sheet et faciliter les analyses économiques et métallurgiques. Ces différents actifs peuvent avoir des effets significatifs sur la cinétique de flottation de ces minerais. (CYTEC, 2010)

 

Ce travail de fin d’étude se veut être une contribution sur l’étude de la concentration des minerais oxydés cupro-cobaltifères du Katanga. Il consiste à une étude comparative sur la cinétique des collecteurs PNBX et AERO 6493 lors de la flottation à la mousse. Dune part, les minerais  oxydés  cupro-cobaltifères  ne  sont  pas  facilement  récupérables  à  l’aide  des collecteurs des sulfures (tels les xanthates). Pour les permettre de flotter, il est d’usage industriel de les sulfurer superficiellement afin de les flotter comme des minéraux sulfus (KANDA, 2012). Et dautre part, l’alkyl hydroxamate (AERO 6493) est présenté comme étant sélectif pour le cuivre suite à la nature de son groupe polaire et sa courte chaine hydrocarbonée qui lui conre sa solubilité. (CYTEC, 2010)

 

Dans cette vision d’étude, les objectifs de ce travail seront de produire les données cinétiques des collecteurs PNBX et AERO 6493 relatives à la flottation à la mousse, reproduire les données statistiques et les analyser afin dapporter un degré de confiance aux résultats de la flottation. Les essais porteront sur les rejets de la laverie de Luiswishi contenant la malachite, la chrysocolle, le pseudo malachite et l’hétérogénite comme principaux minéraux valorisables dont  les teneurs moyennes en cuivre et cobalt sont respectivement 1,65 % et 1,2 %.


Deux types d’études statistiques seront utilisés pour évaluer les résultats de flottation et de la cinétique des collecteurs : la statistique descriptive (l’analyse de données) et l’inférence statistique. Lanalyse de données permet de dégager les caracristiques essentielles du phénomène étudié et suggérer des hypothèses pour une étude ultérieure plus sophistiquée. Quant à l’inférence statistique, elle a pour but de faire des prévisions et de prendre de décisions au vu des observations.

 

Le présent travail comporte 4 chapitres. Le premier chapitre présente les rappels sur la méthode statistique. Le chapitre 2 porte sur la cinétique de flottation. Quant au chapitre 3, il présente les méthodes, matériels et matières utilisés au cours de notre étude. Enfin un quatrième chapitre qui  est consacaux résultats de la flottation, à ceux de l’étude sur la cinétique de flottation ainsi que les analyses statistiques. La conclusion, les suggestions et les annexes terminent ce travail.


CHAPITRE I : RAPPEL DES NOTIONS IMPORTANTES SUR LA METHODE STATISTIQUE

 

 

I.1. Introduction

 

La statistique est la science dont l’objet est de recueillir, de traiter et danalyser des données issues de l’observation de phénomènes aatoires, cest-à dire dans lesquels le hasard intervient. Lanalyse des données est utilisée pour décrire les phénomènes étudiés, faire des prévisions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes.

 

La statistique est utilisée en science de l’ingénieur pour le contrôle de qualité, maîtrise statistique des procédés, sure de fonctionnement (fiabilité, disponibilité, sécurité,…), maîtrise des risques industriels, évaluation des performances des systèmes complexes,… (Gaudoin,

2010)

 

I.2. Terminologies fondamentales

 

a Une statistique : grandeur calculée à partir des observations recueillies (ex : moyenne

 

d’âge des élèves d’une même classe, etc.).

 

b.   Population : groupe d’individus ou d’éléments auquel nous nous intéressons, ensemble

 

de « référence » sur lequel portent les observations.

 

Définir la population d’étude est un point fondamental, dans la mesure tout ce que nous pouvons observer, dire ou calculer est relatif à cette population. Lappellation « population cible » désigne l’ensemble des individus auxquels on veut étendre (inférer) les résultats des observations faites sur un échantillon. (Clarence, 2011)

 

c.  Echantillon : Le plus souvent, il est difficile d’étudier tous les éléments d’une population donnée. Il est tentant alors d’essayer d’examiner un sous-groupe de cette population d’étude et d’essayer de déduire, à partir des observations effectuées sur ce sous-groupe, le comportement de la population générale. La difficulté réside dans le choix du ou des échantillons qui doivent être représentatifs de la population.

d.   Mesure et variables : dans une enquête ou une expérience, toute l’information dont on dispose est contenue dans les mesures qui ont été réalisées. Dans le vocable statistique, un individu peut être décrit selon une ou plusieurs composantes qu’on appelle caractères ou variables statistiques :


v  Une variable aatoire est une quali ou une quanti dont la valeur observée est sujette aux variations selon les lois du hasard.

v  Par contre, une variable mathématique est une variable déterministe : ses valeurs sont

 

déterminées par linvestigateur.

 

Les modalités sont les différentes situations disjonctives et exhaustives dune variable, ce qui signifie que chaque individu présente une modalité et une seule de cette variable. Il existe deux types de variables : les variables quantitatives et qualitatives.

 

Ø Variables quantitatives : caracristiques numériques (taille, âge,). Elles s’expriment par des nombres els sur lesquels les opérations arithmétiques de base (somme, moyenne,) ont un sens. Elles peuvent être disctes (nombre fini ou dénombrable de valeurs : âge,...) ou continues (toutes les valeurs réelles sont susceptibles d’être prises : taille,…).

Ø Variables qualitatives : caractéristiques non numériques dans le sens les opérations de base n’ont pas de sens. Elles peuvent être nominales (sexe,..) ou ordinales lorsque lensemble des catégories est muni d’un ordre total (ts résistant, assez résistant, peu résistant,..). Les difrents niveaux d’une variable qualitative sappellent des modalités (ou catégories).

e Série statistique : Une série statistique est l’ensemble des valeurs observées pour une ou plusieurs variables sur les n sujets ou éléments de la population. Une série simple est l’ensemble des n valeurs observées pour une variable.

 

Ou encore, On appelle série statistique la suite des valeurs prises par une variable X sur les unités d’observation. Le nombre d’unités d’observation est noté n. Les valeurs de la variable X sont notées : x1, . . ., xi, . . ., xn. (Tillé, 2010)

 

f.   L’unité statistique : est un élément de la population ou du groupe étudié. Lensemble des unités statistiques constitue la population. Parfois le terme « unité » est remplacé par le terme « individu ».

g Distribution statistique : il s’agit de l’ensemble des couples (xi, ni), xest la ième

 

modalité de la variable X, et ni le nombre de fois où cette modalité est observée (effectif ou fquence).

h.     Recensement : Etude de tous les individus d’une population. Difficile en pratique

 

lorsque les populations sont grandes pour des questions de coût et de temps.

 

i.      Sondage : Recueil d’une partie de la population.  La partie des individus étudiés s’appelle l’échantillon. Le recueil d’un échantillon à partir de la population initiale se fait par des techniques statistiques, appees méthodes d’échantillonnage.


I.3. La démarche statistique

 

La  statistique  et  les  probabilités  sont  les  deux  aspects  complémentaires  de  l’étude  des

 

phénomènes aléatoires. Ils sont cependant de natures bien différentes.

 

Les probabilités peuvent être envisagées comme une branche des mathématiques pures, basée sur la théorie de la mesure, abstraite et complétement déconnectée de la réalité. Les probabilités appliquées proposent des modèles probabilistes du déroulement de phénomènes aatoires concrets. On peut alors, palablement à toute expérience, faire des prévisions sur ce qui va se produire. (Gaudoin, 2010)

 

Dans la présente étude, nous allons utiliser deux grands outils de la statistique : l’analyse des données (statistique descriptive) et l’inrence statistique.

 

I.3.1. La statistique descriptive univariée

 

Ø  Objectifs : résumer, synthétiser l’information contenue dans une série statistique,

 

mettre en évidence ses propriétés.

 

Ø  Outils  utilisés  :  Tableaux  (table  des  fquences,..),  Graphiques  (histogrammes,..), indicateurs (moyenne, corlation,..).

Ø  thodes : Statistique descriptive classique (uni et bidimensionnelles)

 

Il existe trois types de paramètres ou indicateurs de la statistique descriptive : les paramètres de position ont pour objet de situer le point (sa position) autour duquel les valeurs observées se distribuent ; les paramètres de dispersion mesurent leur degré de variabilité ; enfin, les paramètres de forme, moins utilisés, renseignent sur la forme de la distribution. (Clarence,

2011)

 

I.3.1.1. Les paramètres de position :

 

a. La moyenne arithmétique : La moyenne est la somme des valeurs observées divisée

par leur nombre, elle est notée ̅ : (Tillé, 2010)

 

̅ = 1+2+3++++ = 1      


�                                �     =1


𝑖   [I-1]


 

La moyenne peut être calculée à partir des valeurs distinctes et des effectifs :

 


̅ = 1


�  [I-1]


     =1


𝑖   𝑖


b.   La diane : La médiane empirique de l’échantillon, notée ̃ ou ̃1/2 , est un réel qui

partage  léchantillon  ordon en  deux  parties  de  même  effectif.  La  moitié  des


observations sont inférieures à ̃ et l’autre moitié lui sont supérieures. Il y a donc une

chance sur deux pour qu’une observation soit inférieure à la médiane, et évidemment

 

une chance sur deux pour qu’une observation soit supérieure à la médiane. (Gaudoin,

 

2010).

 

Si n est impair, la médiane empirique est la valeur située au centre de l’échantillon ordon :

 


̃ =    +1

2


[I-2]

∗                     


Si n est pair, nimporte quel nombre compris entre /2 et  +1 vérifie la définition de la

2

médiane. Par convention, on prend en général le milieu de cet intervalle :

 

∗               

̃ = (/2 +   +1 )/2  [I-3]

2

c Quantiles (percentiles) : est la division  de laxe en un nombre quelconque de parties,

 

généralement la division de l’axe en cent parties égales. Par définition mathématique,

 


 

 

 

 

Avec p l’ordre du quantile.


 =


.

[I-4]

100


 

d.   Mode : est la valeur observée avec la plus grande fquence. Sa valeur s’obtient

 

directement à partir du tableau statistique ou du diagramme en bâtons.

 

I.3.1.2. Les paramètres de dispersion :

 

Pour  exprimer  les  caracristiques  d’un  échantillon,  il  est  nécessaire  de  compléter  les

indicateurs de localisation par des indicateurs de dispersion, qui mesureront la variabilité des données.

 

2            1         �                                     2


a La variance : L’indicateur correspondant est  = =1(𝑖 ̅ )


[I-5]. Il est appelé


 

variance  empirique  de  l’échantillon,  et  mesure  l’écart  quadratique  moyen  de l’échantillon à sa moyenne. (Gaudoin, 2010)

b.   L’écart-type : Lécart-type empirique de l’échantillon est la racine carrée de la

 
variance empirique : �   =  2  [I-6]. Il s’exprime dans la même unité que les données,

ce qui rend son interprétation plus facile que celle de la variance.

 

Ainsi on définit le coefficient de variation empirique de l’échantillon par :

 


 
𝑣  =

̅


[I-7]


L’intérêt de cet indicateur est qu’il est sans dimension. Une pratique empirique courante est de considérer que léchantillon possède une variabili significative si cvn > 0,15. Si cvn 0,15, les données présentent peu de variabilité et on considère que la moyenne empirique à elle seule est un bon sumé de tout léchantillon. (Gaudoin, 2010)

 

c Etendue ou plage : est la différence entre la plus grande valeur de données et la plus petite. (LUAMBA, 2017)

Elle est définie mathématiquement par la relation : = 1(maximum-minimum)

d.   Moment : On appelle moment à l’origine dordre r N le paramètre :

 

         1       �         �


 = =1 𝑖

On appelle moment centré d’ordre r ϵ N le paramètre :


[I-8]


 

1      �                          2


 = =1(𝑖 ̅)


[I-9]


 

Les moments généralisent la plupart des paramètres. On a en particulier :

1

 
-        = ̅,

-     1  = 0,

            1         �            2                2                2


 
-     2  = =1 𝑖

-     2  = 2


=  + ̅  ,


 

Signalons que les moments d’ordres supérieurs (r = 3, 4) sont utilisés pour mesurer la symétrie

 

et laplatissement. (Tillé, 2010)

 

I.3.1.3. Les paramètres de forme ou de dissymétrie :

 

a.   Le coefficient d’asymétrie de Fisher (skewness)

 

Le moment centré d’ordre trois est défini par :

 

1       �                          3


3  = =1(𝑖 ̅)


[I-10]


 

Il peut prendre des valeurs positives, négatives ou nulles. Lasymétrie se mesure au moyen du

 

coefficient d’asymétrie de Fisher :

 


 

 
3 est le cube de l’écart-type.


1  =


3

 
3     [I-11]

𝑥


A part le coefficient d’asymétrie de Fisher, il existe d’autres qui sont basés sur les indicateurs

 

de localisation, tel est le cas des coefficients d’asymétrie de Yule et de Pearson.

 

Pour le cas de Pearson, on dit qu’une distribution de fquences est positivement dissytrique ou dissymétrique  à droite si la portion de sa courbe située à droite du sommet (mode) est plus longue que lautre. En général, pour les distributions positivement dissytriques, on observe que : mode < médiane < moyenne ; (Clarence, 2011)

 

Et  pour les distributions négativement dissymétriques : moyenne < médiane < mode

 

 

Ce coefficient est calculé par la relation :

 


𝑖  =


3(���é�𝑖𝑎�)

[I-12]


 

I.3.1.4. Les paramètres daplatissement (Kurtosis)

 

Laplatissement est mesu par le coefficient daplatissement de Fisher :

4


2  =


 − 3  [I-13]

 
𝑥


 
4 est le moment centré d’ordre 4, et 4 est le carré de la variance.

-     Une courbe mésokurtique si g2 0.

 

-     Une courbe leptokurtique si g2  > 0. Elle est plus pointue et possède des queues plus longues.

-     Une courbe platykurtique si g2 < 0. Elle est plus arrondie et possède des queues plus courtes.

 

I.3.2. La statistique descriptive bivariée

 

On s’intéresse à deux variables x et y. Ces deux variables sont mesurées sur les n unités d’observation. Pour chaque unité, on obtient donc deux mesures. La série statistique est alors une suite de n couples des valeurs prises par les deux variables sur chaque individu :

 

(x1, y1), . . ., (xi, yi), . . ., (xn, yn). Chacune des deux variables peut être, soit quantitative, soit qualitative. Notre étude ne fait référence qu’au cas de deux variables quantitatives.


I.3.2.1. Analyse des variables

Les variables x et y peuvent être analysées sépament. On peut calculer tous les paramètres dont les moyennes et les variances :

 


̅ = 1     


et         2  = 1 


( ̅


)2 [I-14]


     =1    𝑖


�        �      =𝑖            �


̅ = 1       


et         2  = 1 


( ̅


)2 [I-15]


     =1    𝑖


�        �      =𝑖           �


 

Ces  paramètres  sont  appelés  paramètres  marginaux  :  variances  marginales,  moyennes marginales, écarts-types marginaux, quantiles marginaux, etc… (Tillé, 2010)

 

I.3.2.2. La covariance

 

Une premre synthèse nurique de lassociation entre x et y est donnée par le coefficient de covariance défini par :

 

La covariance est la moyenne du produit des écarts (xi-x)(yi-y).

 

Elle est définie mathématiquement suivant la relation [I-17]

 


���(, ) = ���(, ) = 1


( ̅


) (


̅


)    [I-16]


     =1   𝑖


�         𝑖           �


 

En cas de covariance positive, le diagramme de dispersion correspondant à une forme générale croissante. Si les valeurs élevées d’une série s’accompagnent des valeurs élevées de lautre série (même chose pour les valeurs basses), alors les produits (xi-x)(yi-y) sont positifs et par conséquent la covariance est-elle aussi positive. Les deux séries sont alors positivement corrélées. En cas de covariance négative, le diagramme de dispersion a une allure générale décroissante. Dans le cas d’une covariance nulle, on ne peut pas affirmer qu’il n’existe pas de dépendance entre les deux variables. (Clarence, 2011)

 

I.3.2.3. Coefficient de corrélation

 

Le coefficient de corrélation entre 2 variables quantitatives x et y est égal au rapport de la covariance de X et Y divisé par le produit des écart-types de x et y.

Le coefficient de corrélation est noté ρ dans la population :

 


=       ��(,)

�𝑎()�𝑎()


[I-17]


 

-     Lors que les deux variables sont indépendantes, la cov(x,y) = 0 ;

 

-     La cov(x,x) = var (x) ;

 

-     Si  ρ=1, x et y sont corrélées positivement ;


-     Si ρ=-1, x et y sont corlées négativement ;

 

-     Si ρ=0, x et y sont indépendants. (LUAMBA, 2017)

 

I.3.2.4. Coefficient de détermination

 

Le coefficient de détermination est le car du coefficient de corrélation :

 


2

 
2  =   (��(,))

�𝑎� ().�𝑎()


[I-18]


 

La valeur du représente la proportion de la variation de la réponse qui est expliquée par le modèle. Lorsqu’elle est élevée cela signifie que le modèle est exhaustif, alors qu’un faible indique que  certaines variables importantes n’ont pas é prises en compte dans le modèle, qu’elles ont é « oubliées » ou que les conditions environnementales sont bruitées ou instables ou encore que la mesure de la ponse n’est pas précise….

 

Cependant, le R² peut être trompeur pour évaluer la qualité dun modèle :

 

 

Problème n°1 : Chaque fois que vous ajoutez un prédicteur dans le modèle, la valeur du augmente, même si cela est juste dû au seul hasard. Le R² ne diminue jamais. Un modèle avec plus de termes aura toujours un meilleur R² tout simplement parce qu'il a plus de termes.

 

Problème n°2 : Si un modèle a trop de prédicteurs et/ou de termes d'ordre élevé, il modélisera en réali le bruit aatoire dans les données. Un modèle sur-ajusté produit des valeurs de R² trompeuses, très élevés mais une mauvaise capacité de prédire de nouvelles observations. Le modèle dévient inutilement complexe, peu pertinent, difficile à expliquer et peu robuste.

 

Il faut résister à l'envie d'ajouter toujours plus de prédicteurs dans un modèle de gression pour maximiser le ; les R² ajusté et prévu peuvent vous être utiles en cela.

 

Quest-ce que le R² Ajusté ?

 

Le ajusté prend en compte le nombre de termes de votre modèle. Si vous comparez un modèle à cinq prédicteurs à un autre modèle à six prédicteurs qui a un plus élevé, cela signifie-t-il que le du modèle à six prédicteurs est plus élevé parce que ce modèle est vraiment meilleur ? Ou est-il plus élevé parce qu'il y a simplement plus des prédicteurs ? Le ajusté permet de le savoir. Le R² ajusté est une version modifiée du R², il est ajusté pour tenir compte du nombre de prédicteurs dans le modèle. Le R² ajusté naugmente que si le nouveau terme améliore le modèle plus que prévu par le hasard. Il peut même diminuer quand un prédicteur améliore le modèle moins que prévu par le simple hasard. Le ajusté est toujours inférieur au R².


Signalons que le R2 prévu est plus utili dans les sessions de Minitab. Or dans cette étude, nous nous limiterons au logiciel Excel. (Scibilia, 2019)

 

I.3.2.5. La régression linéaire

 

La régression sadresse à un type de problème les 2 variables quantitatives continues x et y ont un rôle asymétrique : la variable y dépend de la variable x. La liaison entre la variable y dépendante et la variable x indépendante peut être modélisée par une fonction de type :

 

y = a + bx, [I-19]

 

représentée graphiquement par une droite. (LABARERE, 2012)

 

Le problème consiste à identifier une droite qui ajuste bien le nuage de points. Si les coefficients

 

a et b étaient connus, on pourrait calculer les résidus de la régression définis par :

 

ei = yi - a - bxi. [I-20]

 

Le résidu ei est lerreur que l’on commet en utilisant la droite de gression pour prédire yi à partir de xi. Les résidus peuvent être positifs ou négatifs.

Pour déterminer la valeur des coefficients a et b on utilise le principe des moindres carrés qui consiste à chercher la droite qui minimise la somme des cars des résidus : (Tillé, 2010)

 

�         2              �                                          2


(, ) = =1 𝑖


= =1(𝑖 − � 𝑖 )


[I-21]


 

Les coefficients a et b qui minimisent le critère des moindres carrés sont donnés par :

 


 

2

 
= ��(,)

𝑥

I.3.2.6. Erreur type destimation


��      � = ̅ ̅  [I-22]


 

La droite d’estimation (droite de régression) exprime seulement une tendance centrale de l’estimation de la variable correspondante, y par exemple pour la droite d’estimation de y en x.

 

Il y a inrêt à associer la connaissance de la tendance centrale un indice qui renseigne sur la dispersion correspondante. Cette dispersion de lestimation est représentée par les écarts des points du diagramme par rapport à la droite d’estimation correspondante. (Clarence, 2011). Cet indice est déterminé par la racine carrée de la variance des résidus, soit :

Erreur d’estimation de y en x :  = 1 2   [I-23]

Avec l’écart-type de la variable Y.


I.3.3. La statistique inférentielle

 

I.3.3.1. Définitions :

 

Inférer signifie Obtenir, à partir de mesures sur une partie de la population (échantillon), des informations (de caracre probabiliste) sur la totalité de celle-ci. (Aliferis, 2008)

 

Ø  Spécificité :

 

-     La série de données est considérée comme un échantillon dune population ;

 

-     suppose un modèle probabiliste sur la population ;

 

-     Nécessite des méthodes d’échantillonnage.

 

Ø  Objectifs :

 

-     étendre (inrer) les propriétés constatées sur l’échantillon à la population ;

 

-     Valider ou infirmer des hypothèses sur la population énoncées a priori ou formulées après une phase exploratoire.

Ø  thodes :

 

-     Estimation : approcher des paramètres de la population à partir de léchantillon ;

 

-     Tests : valider ou infirmer les hypothèses émises sur ces paramètres ;

 

-     Modélisation et de prévision : recherche d’une relation entre une variable et plusieurs

 

autres, valable pour l’ensemble de la population.

 

L’inférence statistique traite principalement deux types de problèmes : l’estimation de paramètres (espérance, variance, probabilité de succès) et les tests d’hypothèses. L’inférence statistique ne conduit jamais à une conclusion stricte, elle attache toujours une probabilité à cette conclusion. Cela provient du fait que l’on tente de tirer des conclusions sur une population (grand nombre d’individus) sur la base des observations réalisées sur un échantillon, représentant une portion restreinte de la population. (Clarence, 2011)

 

I.3.3.2. thodes destimation

 

Le problème traité dans cette section est celui de lestimation du paramètre θ. Comme on l’a dé dit, il s’agit de donner, au vu des observations x1,…, xn, une approximation ou une évaluation de θ que l’on espère la plus proche possible de la vraie valeur inconnue. On pourra proposer une unique valeur vraisemblable pour θ (estimation ponctuelle) ou un ensemble de valeurs vraisemblables (estimation ensembliste ou gion de confiance).

 

Par définition, un estimateur d’une grandeur θ est une statistique Tn à valeurs dans lensemble des valeurs possibles de θ. Une estimation de θ est une réalisation tde lestimateur Tn. Un estimateur est donc une variable aléatoire, alors qu’une estimation est une valeur déterministe.


Il existe de nombreuses méthodes pour estimer un paramètre θ. Dans cette section, nous ne nous

 

intéressons qu’à la méthode des moments. (Gaudoin, 2010)

 

 

A.  thode de Moment

 

C’est la méthode la plus naturelle. L’idée de base est d’estimer une espérance mathématique

 

par une moyenne empirique, une variance par une variance empirique, etc...

 

Si le paramètre à estimer est l’espérance de la loi des Xi, alors on peut l’estimer par la moyenne empirique de léchantillon. Autrement dit, si θ = E(X), alors l’estimateur de θ par la méthode

des moments (EMM) est :

 


𝜃̃ = 𝑋̃ =


1     

 
�     =1


𝑖


[I-24]


 

Plus généralement, pour θ ϵ IR, si E(X) = φ(θ), φ est une fonction inversible, alors

l’estimateur de θ par la méthode des moments est 𝜃̃ = φ1(𝑋̃ ) et aussi

Si x1,…, xn sont des variables indépendantes et de même loi normale (, 2), E(X) = m et

var(x) = s2, donc l’estimateur de m et s2 par la thode des moments sont :

 


2

 
̃  = 𝑋̃ �� ̃  =


[I-25]


 

I.3.3.3. Estimation et Test du coefficient de corrélation (LABARERE, 2012)

 

v  Estimation du coefficient de corrélation :

 

Le coefficient de corrélation esti sur un échantillon issu d’une population est noté r. Il s’interprète comme le coefficient de corrélation ρ mesuré sur la population. Il est calculé à partir des estimations de la covariance et des variances de X et de Y sur léchantillon.

 

                [I-26]

 

Ce qui conduit à l’expression mathématique :

 

 

 

 

 

[I-27]


Signalons que n est le nombre total d’effectifs, les m sont les paramètres obtenus par estimation

 

de la variance et de la covariance.

 

v  Test du coefficient de corrélation :

 

Aps le calcul du coefficient de corrélation r estimé sur un échantillon, il faut déterminer si le

 

coefficient de corlation ρ est significativement difrent de 0.

 

-     Lhypothèse nulle : H0 : ρ = 0 (absence de liaison [linéaire] entre X et Y)

-     Lhypothèse alternative : H1 bilarale : ρ 0 (existence d’une liaison entre X et Y),

cest-à-dire r @ ρ.

 

 

Sous l’hypothèse nulle (H0) :

 

Le rapport de l’estimateur du coefficient de corrélation r sur son écart-type suit une loi de

 

Student à (n-2) degrés de liberté. n est leffectif de l’échantillon.

 

 
 (2)���

 

Lestimateur de lécart-type du coefficient de corlation est égal à :

 
�   = 12    [I-28]

2

 

Le test du coefficient de corlation consiste à calculer la grandeur to et à la comparer à la valeur

 

seuil tα sur la table de la loi de Student à (n-2) degrés de libertés.

 

 

 
   2

0  = 12    [I-29]

Cette expression permet de décider de la corrélation entre les deux variables x et y de l’étude à

 

travers l’image de la figure I-1.


 

Figure I-1 : Test de T Student

 

I.3.3.4. Intervalle de confiance (Gaudoin, 2010)

 

Un intervalle de confiance de seuil (ou niveau de signification) α ϵ [0; 1] pour un paramètre θ, est un intervalle aléatoire I tel que P ϵ I) = 1 − α.

 

α est la probabilité que le paramètre θ nappartienne pas à l’intervalle I, cest à dire la probabilité que l’on se trompe en affirmant que θ ϵ I. C’est donc une probabilité d’erreur, qui doit être assez petite. Les valeurs usuelles de α sont 10%, 5%, 1%, etc.

 

Le problème à gler est de trouver un pro pour déterminer un intervalle de confiance pour

 

un paramètre θ.  Il semble logique de proposer un intervalle de confiance centré sur un

estimateur  performant  𝜃̂ ,  cest-à-dire  de  la  forme  𝐼 = [𝜃̂ , 𝜃̂ + ].  Il  reste  alors  à

déterminer de sorte que :

(𝜃 𝜖 ) = (𝜃̂ 𝜀   𝜃 𝜃̂ + ) = (|𝜃̂ | ) = 1 𝛼 [I-30]

Mais cette démarche ne va pas toujours aboutir. En effet, α est un réel fixé à l’avance qui ne

 

doit pas dépendre de θ. 𝜀 ne doit pas non plus dépendre de θ pour que l’intervalle soit utilisable. Par conséquent, on ne peut déterminer un 𝜀  vérifiant l’égali ci-dessus que  si la loi de probabilité de 𝜃̂ 𝜃 ne dépend pas de θ, ce qui nest pas toujours le cas.


Si cet intervalle de confiance est petit, l’ensemble des valeurs vraisemblables pour θ est resser

autour de 𝜃̂ . Si l’intervalle de confiance est grand, des valeurs vraisemblables pour θ peuvent

être éloignées de 𝜃̂ . Donc un intervalle de confiance construit à partir d’un estimateur permet

de mesurer la précision de cet estimateur. Pour trouver un intervalle de confiance, il existe

 

plusieurs méthodes. La plus efficace consiste à chercher une fonction pivotale, cest à dire une variable aléatoire fonction à la fois du paramètre θ et des observations X1,…, Xn, dont la loi de probabilité ne dépende pas de θ.

 

I.4. Méthode statistique dajustement

 

De nos jours, la régression linéaire sous contraintes fait partie de la boîte à outils de la statistique appliquée. Les contraintes portent le plus souvent sur les coefficients de la gression et se traduisent par des équations ou des inéquations linéaires et non-linéaires. La fonction objective la plus classique est sans doute le critère des moindres carrés. Naturellement, d’autres fonctions objectives que la somme des carrés des résidus de l’ajustement peuvent être retenues, les moindres valeurs absolues par exemple. (Falguerolles, 2009)

 

Aps avoir calculé les meilleures valeurs des paramètres dans le cadre du modèle mathématique choisi, on peut examiner la correspondance existant entre le phénomène observé et la représentation théorique. Il se peut en effet que le modèle mathématique ne corresponde pas à la réali ou que le processus dajustement nait pas conduit aux valeurs les plus adéquates des paramètres.

 

Un premier examen des résultats peut se faire très rapidement au vu du graphique représentant les points observés et la courbe théorique. Une deuxième critique de l’ajustement peut se faire en examinant la distribution des résidus de gression. Lespérance mathématique de ces résidus étant nulle, leur moyenne doit normalement être proche de 0. (STEINIER, 1974)

 

Le critère des moindres cars est très sensible à des observations atypiques ou « hors norme », cest-à-dire qui présentent des valeurs trop singulières. Létude descriptive initiale permet sans doute déjà d’en repérer mais cest insuffisant. Un diagnostic doit être établi dans le cadre spécifique du modèle recherc afin d’identifier les observations influentes, cest-à-dire celles dont une faible variation du couple (xi, yi) induit une modification importante des caracristiques du modèle.

 

Ces observations repées, il ny a pas de remède universel : supprimer une valeur aberrante, corriger une erreur de mesure, construire une estimation robuste, ne rien faire…, cela dépend du contexte et doit être négocavec le commanditaire de létude. (WikiStat, 2017)


En ce qui concerne la présente étude, nous choisirons de construire un modèle robuste. D la

 

dépendance de y en x peut être bien représentée par la relation du type :

= + + 𝜀 [I-31]

Avec  a  le  coefficient  inconnu,  b  la  constante  indépendante  et  ɛ  un  terme  aatoire  non

 

observable. A partir des données (xi, yi), on doit estimer les coefficients a, b et certaines caracristiques de