Statistiques appliquées - Semestre 2


Ajustement et Corrélation

Présentation

Réaliser un ajustement c'est aussi parfois prendre parti, il faut donc en être conscient et comprendre pourquoi.


Méthodes d'ajustement

Vous trouverez dans les manuels de base la présentation de deux méthodes d'ajustement, si on peut dire, que sont la méthode des points extrêmes et celle de Mayer. Je les évoque également dans le support pdf en précisant qu'il convient de ne pas les utiliser tant elles sont imprécises et partielles. Donc ne les utilisez pas et travaillez la seule digne de confiance qui est celle des moindres carrés, exposée ci-dessous.

Celle-ci vous premettra:

  • de disposer du meilleur ajustement possible
  • d'étudier les deux relations relations possibles entre les deux caractères (x vers y et y vers x)
  • de disposer des calculs et résultats intermédiaires permettant le calcul du coefficient de corrélation

A l'image de la présentation de la variance effectuée au semestre 1, nous allons présenter deux "versions" de ces résultats, de fait deux présentations de la même formule pour aboutir bien évidement au même résultat.

Ces données se prêtant parfaitement au travail sur tableur il n'y a aucune raison de s'en priver. Le tableur sera la base de la présentation de la méthode en incorporant toutes les étapes des calculs et des résultats intermédiaires.

Méthode des moindres carrés - Version 1

Cette première présentation de la méthode des moindres carrés effectue un changement de variables pour xi et yi. Concrètement lors de l'élaboration des calculs et résultats intermédiaires on va soustraire la moyenne de chacuune des séries pour obtenir Xi et Yi.

Les résulats intermédiaires seront donc ΣXi², ΣYi² et ΣXiYi.


Méthode des moindres carrés - Version 2

Cette seconde présentation part des valeurs d'origine de la srie, sans aucun changement de variable.

Les résultats intermédiaires sont donc à présent avec des petits x et y: Σxi², Σyi² et Σxiyi.


Corrélation

Versions 1 et 2

Il est intéressant de pouvoir mesurer l'internsité du lien statistique entre deux séries (ou deux caractères): c'est ce que permet de coefficient de corrélation. Son calcul repose sur les résultats des mondres carrés ce qui va faciliter notre travail.

En revanche attention son interprétation n'est pas forcément toujours intuitive.

Ajustement, corrélation et informatique.

Les fonctions du tableur

Dans la présentation précédente nous avons utilisé le tableur comme support et il remplaçait n'importe quel logiciel pouvant préenter des tableaux. A la limite un traitement de textes aurait pu suffire car kes calculs étaient plus que limités.

Cependant les tableurs disposent de fonctions performantes qui vont nous permettre de déterminer tous les coefficients précédents de manière bien plus rapide.

Utilisation du logiciel R

L'exemple du cours avec la saisie des valeurs des deux séries Pub et CA.


Le même exemple avec les valeurs présentes dans un fichier distant au format CSV.


Fichiers utilisés dans ces vidéos

Correction TD 1 Ajustement et corrélation - Séance semaine 16 mars en ligne

Fichiers utilisés

Corrélation - Cas de l'élection présidentielle de 2017 - vidéo créée le 22 mars 2020.

Fichiers utilisés

Cas de synthèse - Entraînement TEST - Eléments de correction en 3 parties - vidéos créées le 20 avril 2020

Partie 1:

Partie 2:

Partie 3:

Fichiers utilisés



Infos légales - Cours réservés aux étudiants de Tech de Co Bordeaux - Tous droits réservés - Bernard Andruccioli - 2016 -