Présentation
RÉSUMÉ
Devant l'ampleur croissante de l'utilisation des statistiques et la diversité des moyens informatiques dont l'ingénieur dispose, il a semblé nécessaire de présenter dans cet article les fonctionnalités les plus utilisées en statistique au regard des principaux logiciels disponibles, ceux-ci étant soit sous licence soit libre. Statistique descriptive, tests, analyse de variance, régression ou encore analyse en composantes principales sont présentés sous forme d'exemples traités à l'aide des logiciels Excel, XLSTAT, SAS, JMP IN et R.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Thérèse PHAN : Professeur agrégée - École Centrale Paris
INTRODUCTION
Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d'échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l'utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d'autres, à cible plus générale, ont été enrichis de fonctions statistiques. Le présent article vise à mettre en relief leurs fonctionnalités de base au travers d'exemples.
Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif alors que, pour un cadre d'entreprise, les choix de l'entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques ont été retenus en fonction de leur appartenance à l'une des différentes familles ressortissant de ce prisme, sans préjuger d'une quelconque prééminence par rapport aux autres membres de sa famille :
-
Excel : à disposition de toute suite MS-Office (sous Windows ou MacOS), il a ouvert la voie à différents compléments, tel XLSTAT, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l'éditeur d'Excel ;
-
SAS : logiciel précurseur très complet, il fait référence auprès de nombreux statisticiens, même s'ils en utilisent d'autres ;
-
JMP IN : version « grand public » de SAS, il s'est placé en concurrence frontale avec des produits d'excellente facture conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat…) ;
-
la famille « Open source », représentée par le logiciel R, associée avec la gratuité d'utilisation des logiciels (licence GNU) et la collégialité de leur évolution ;
-
enfin, n'ont pas été pris en considération, pour le présent article, les développements « locaux », réalisés dans le cadre d'organisations ou de particuliers. Nous pouvons ainsi citer le logiciel gratuit de modélisation des résultats d’étalonnage M-CARE, mis au point par le Collège français de métrologie.
La présentation des fonctionnalités de ces différents logiciels se concentre sur :
-
les fonctions de base ;
-
les tests d’ajustement et de comparaison ;
-
l'analyse de variance à simple et à double entrée ;
-
l'analyse de régression ;
-
l’analyse en composantes principales.
VERSIONS
- Version archivée 1 de sept. 2006 par Thérèse PHAN
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Mesures - Analyses > Instrumentation et méthodes de mesure > Méthodes de mesure > Logiciels de statistique - Exemples et applications > Statistique descriptive
Présentation
Article inclus dans l'offre
"Métier : responsable qualité"
(254 articles)
Actualisée et enrichie d’articles validés par nos comités scientifiques.
Quiz, médias, tableaux, formules, vidéos, etc.
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.
Un ensemble de services exclusifs en complément des ressources.
2. Statistique descriptive
Les exemples développés dans le présent chapitre s'appuient sur l'échantillon de mesures présenté tableau 1.
2.1 Statistique descriptive avec Excel
La présente section fournit des exemples des fonctions préprogrammées d'Excel et illustre le travail de préparation des données nécessaire à l'emploi de ses fonctions graphiques.
En effet, les fonctions graphiques de Excel ne sont que des fonctions de dessin : ainsi, elles permettent de reproduire graphiquement un tableau de données en lui conférant l’apparence d’un histogramme ou d'une courbe (d'autres formes sont disponibles), mais ne présentent aucune « intelligence » dans le traitement des données. Par exemple, pour un histogramme, Excel va dessiner un « bâton » pour chaque mesure, dans l'ordre de lecture, sans aucune notion ni d'intervalle ni de cumul. Il appartient donc à l’utilisateur de préparer ses données avant de les « dessiner » avec Excel.
HAUT DE PAGE
Excel s'accommode des quelques formats les plus généraux de données : .XLS, .CSV, .DBF, .TXT ainsi que les formats concurrents (Lotus, Quattro…) : l'importation de données demeure limitée à la capacité de Excel (65 536 lignes).
Pour les formats spécialisés (SAS, JMP, bases de données), il faut faire appel aux connecteurs ODBC, distribués avec ces logiciels : mais dès lors que, pour disposer de l'un de ces connecteurs, on a acquis l'un de ces logiciels, mieux vaut le préférer à Excel pour des analyses statistiques, dont les fonctions statistiques sont largement préprogrammées.
HAUT DE PAGE2.1.2 Fonctions préprogrammées
Excel propose un catalogue préprogrammé de fonctions. Appliquées à notre population de mesures, elles apportent, entre autres, les résultats présentés au tableau 2.
Dans le tableau ...
Statistique descriptive
Article inclus dans l'offre
"Métier : responsable qualité"
(254 articles)
Actualisée et enrichie d’articles validés par nos comités scientifiques.
Quiz, médias, tableaux, formules, vidéos, etc.
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.
Un ensemble de services exclusifs en complément des ressources.
BIBLIOGRAPHIE
-
(1) - PHAN (T.), ROWENCZYK (J.-P.) - « Statistique et Probabilités » - Éditions Dunod (exercices et Problèmes, sciences sup) (2007).
-
(2) - POIRIER (J.) - « Analyse de la variance et de la régression, Plans d'expérience » - Éditions Techniques de l'ingénieur vol R 260 (1993).
-
(3) - SAPORTA (G.) - « Probabilités, Analyse des données et Statistique » - Éditions Technip (1990).
-
(4) - VEYSSEYRE (R.) - « Statistique et Probabilités pour l'ingénieur » - Éditions Dunod (l'Usine Nouvelle) (2001).
-
(5) - * - « Aide mémoire statistique », Éditions CISIA-CERESTA (1995).
-
(6) - * - SAS...
ANNEXES
EXCEL : distributeurs Microsoft
SAS : SAS France, Domaine de Grégy, BP 5 – 77166 Grégy-sur-Yerres
JMP : voir SAS
R : logiciel « freeware » en distribution sur Internet
HAUT DE PAGE
SAS :
États-Unis
France
http://www.sas.com/offices/europe/france/
R :
The R Project for Statistical Computing
JMP :
États-Unis
HAUT DE PAGEArticle inclus dans l'offre
"Métier : responsable qualité"
(254 articles)
Actualisée et enrichie d’articles validés par nos comités scientifiques.
Quiz, médias, tableaux, formules, vidéos, etc.
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.
Un ensemble de services exclusifs en complément des ressources.
QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE
Entraînez vous autant que vous le voulez avec les quiz d'entraînement.
Article inclus dans l'offre
"Métier : responsable qualité"
(254 articles)
Actualisée et enrichie d’articles validés par nos comités scientifiques.
Quiz, médias, tableaux, formules, vidéos, etc.
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.
Un ensemble de services exclusifs en complément des ressources.