Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d’échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l’utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d’autres, à cible plus générale ont été enrichis de fonctions statistiques. Le présent dossier vise à mettre en relief leurs fonctionnalités de base au travers d’exemples.
Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif, alors que pour un cadre d’entreprise, les choix de l’entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques, ont été retenus en fonction de leur appartenance à l’une des différentes familles sans préjuger d’une quelconque prééminence par rapport aux autres membres de sa famille :
-
Excel, à disposition de toute suite MS-Office, sous Windows ou MacOS, a ouvert la voie à différents compléments, tel XlStat, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l’éditeur d’excel ;
-
SAS, logiciel précurseur très complet, fait référence auprès de nombreux statisticiens, même s’ils en utilisent d’autres ;
-
JMP IN, version « grand public » de SAS, s’est placé en concurrence frontale avec des produits d’excellente qualité conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat, ...) ;
-
la famille « Open source », représentée par le logiciel R, est associée à la gratuité d’utilisation des logiciels (licence GNU) et à la collégialité de leur évolution ;
-
enfin, n’ont pas été pris en considération, pour le présent dossier, les développements « locaux », réalisés dans le cadre d’organisations ou de particuliers.
La présentation des fonctionnalités de ces différents logiciels se concentre sur :
-
les fonctions de base ;
-
l’analyse de variance à simple et double entrée ;
-
l’analyse de régression.
Pour la définition des termes statistiques, le lecteur se reportera dans ce traité au dossier « Observation statistique » Observation statistique.