Contactez-nous
Analyse en composantes principales
Logiciels de statistique - Exemples et applications
R272 v1 Archive

Analyse en composantes principales
Logiciels de statistique - Exemples et applications

Auteur(s) : Thérèse PHAN

Relu et validé le 15 août 2021

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Familles de logiciels

2 - Statistique descriptive

3 - Analyse de variance

4 - Régression linéaire simple

5 - Analyse en composantes principales

Sommaire

Présentation

Auteur(s)

  • Thérèse PHAN : Agrégée de Mathématiques - Professeur de Probabilités et Statistique à l’École Centrale de Paris

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d’échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l’utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d’autres, à cible plus générale ont été enrichis de fonctions statistiques. Le présent dossier vise à mettre en relief leurs fonctionnalités de base au travers d’exemples.

Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif, alors que pour un cadre d’entreprise, les choix de l’entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques, ont été retenus en fonction de leur appartenance à l’une des différentes familles sans préjuger d’une quelconque prééminence par rapport aux autres membres de sa famille :

  • Excel, à disposition de toute suite MS-Office, sous Windows ou MacOS, a ouvert la voie à différents compléments, tel XlStat, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l’éditeur d’excel ;

  • SAS, logiciel précurseur très complet, fait référence auprès de nombreux statisticiens, même s’ils en utilisent d’autres ;

  • JMP IN, version « grand public » de SAS, s’est placé en concurrence frontale avec des produits d’excellente qualité conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat, ...) ;

  • la famille « Open source », représentée par le logiciel R, est associée à la gratuité d’utilisation des logiciels (licence GNU) et à la collégialité de leur évolution ;

  • enfin, n’ont pas été pris en considération, pour le présent dossier, les développements « locaux », réalisés dans le cadre d’organisations ou de particuliers.

La présentation des fonctionnalités de ces différents logiciels se concentre sur :

  • les fonctions de base ;

  • l’analyse de variance à simple et double entrée ;

  • l’analyse de régression.

Pour la définition des termes statistiques, le lecteur se reportera dans ce traité au dossier « Observation statistique » Observation statistique.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-r272

Lecture en cours
Présentation

Article inclus dans l'offre

"Instrumentation et méthodes de mesure"

(51 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Analyse en composantes principales

5.1 Présentation

Nous allons terminer cet exposé par un exemple d’analyse en composantes principales ACP traité à l’aide de SAS. Nous reportons à l’ouvrage de Gilbert Saporta pour la présentation théorique de cette analyse.

Le tableau 13 donne pour chacun des 17 pays européens étudiés, la répartition du budget (en %) des ménages selon les postes suivants : alimentation, habillement, logement, équipement de la maison, santé, transports, éducation et enfin divers.

Nous allons appliquer une analyse en composantes principales à ce tableau de données. Cette analyse sera conduite avec SAS mais elle peut être aussi menée avec R par exemple. On utilise dans SAS le module interactif.

Rappelons simplement que l’analyse en composantes principales est une méthode d’analyse statistique descriptive multidimensionnelle de données numériques. Elle permet de visualiser les données en projetant les « individus » observés, sur un plan ou dans un espace de dimension 3 construit à l’aide de nouvelles variables indépendantes entre elles et corrélées aux anciennes : les composantes principales. L’observation conjointe des corrélations entre les variables et les composantes principales et de la situation des individus dans le nouvel espace permet de mettre en évidence des liaisons entre les variables ainsi que des comportements similaires chez certains individus.

HAUT DE PAGE

5.2 Analyse en composantes principales avec SAS

Après avoir ouvert « Analyse Interactive de données », dans le menu « Analyse », on sélectionne « Multivariate(X,Y) ». La colonne correspondant aux pays est désignée avec la sélection « Label » et les colonnes contenant les divers postes des budgets sont désignées comme Y. SAS fournit alors les statistiques de base sur les variables Alimentation, Habillement... (figure ...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Analyse en composantes principales

Article inclus dans l'offre

"Instrumentation et méthodes de mesure"

(51 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Instrumentation et méthodes de mesure"

(51 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Topographie – Topométrie – Géodésie

Les différentes techniques employées par les géomètres pour décrire géométriquement le terrain et ...

Ingénierie Kansei, ou comment lier affectivité et conception

Dans le domaine de la conception de produits, il est devenu primordial d’intégrer des paramètres ...

Transposition d'un modèle objet dans un contexte relationnel

La maîtrise des systèmes d'information de plus en plus complexes impose aux entreprises la résolution de ...

Qualification des outils au sens de la norme CENELEC EN 50128:2011 - Logiciels pour les transports ferroviaires

Cet article présente le processus de qualification des outils tel qu'il est défini dans la version 2011 ...