Statistical Analysis System

Statistical Analysis System

SAS (langage)

Page d'aide sur l'homonymie Pour les articles homonymes, voir SAS.
SAS (langage)
SAS logo horiz.svg
Développeur SAS Institute
Dernière version 9.2 (le mars 2008) [+/-]
Environnements Windows, Unix/Linux, OpenVMS Alpha
Type Logiciel de statistiques
Site Web www.sas.com

Le langage de commande de SAS, pour Statistical Analysis System, est un langage de programmation de quatrième génération (L4G) édité par le SAS Institute. Il existe depuis plus de trente ans.

Actuellement (depuis 2004), SAS en est à la version 9, ce qui correspond à une évolution majeure dans le logiciel car il intègre une nouvelle brique conceptuelle destinée à s'implanter dans le monde des logiciels d’informatique décisionnelle (en anglais Business Intelligence).

Il faut donc dissocier la SAS Foundation qui représente le L4G seule et la SAS BI, qui intègre des applicatifs spécifiques.

Sommaire

SAS Foundation (ou SAS V9)

Le logiciel traditionnel se compose d'un ensemble de modules permettant de répondre aux besoins suivants par la programmation :

  1. Création et gestion de bases de données
  2. Traitements analytiques des bases de données
  3. Création et diffusion de rapports de synthèse et de listing.

Le L4G n'a fait que s'enrichir depuis 30 ans sans modifier le code depuis. L'avantage est que les programmes s'exécutent toujours depuis la création, mais aucune normalisation n'a pu être apportée.

Les modules Foundation sont les suivants :

Livrée obligatoirement lors de la location :

  • Base SAS
  • SAS Entreprise Guide (interface Windows plus riche permettant d'exploiter des "Wizards" plutôt que la saisie de code)

Selon les besoins :

  • OLAP (pour générer des cubes dans le cadre d'une utilisation de MOLAP)
  • SAS/ACCESS (1 module spécifique par Base de Données)
  • SAS/FSP (pour la création d'interface)
  • SAS/ASSIST
  • SAS/CONNECT (pour le travail en client-serveur)
  • SAS/GRAPH (pour créer des graphiques)
  • SAS/IML (permettant de coder de l'algèbre linéaire)
  • SAS/STAT (permettant l'accès à toutes les procédures statistiques)
  • SAS/ETS (permettant l'accès à toutes les procédures d'analyse temporelle)

Le langage SAS est basé sur trois parties :

Les étapes DATA. Elles permettent de répondre aux besoins correspondant à la création et à la gestion de bases de données, brique fondamentale de tout système d'information.

Une étape crée ou modifie une table d'observations. En colonne se trouvent le plus souvent un identifiant et des indicateurs et en lignes, les sujets observées.

Par exemple, une table peut contenir la liste des clients d'une banque.

Les procédures ont chacune leur objectif : l'une permet de trier une table, l'autre de compter les lignes ou de synthétiser les indicateurs… ou simplement d'imprimer la table ou un échantillon.

Le langage MACRO est un langage permettant d'automatiser les traitements.

Il est disponible sous MVS, UNIX, Linux et Microsoft Windows.

SAS BI (ou SAS 9)

L'offre de la SAS 9 permet à SAS de fournir des applicatifs ETL et de reporting WEB. Dans tous les cas, l'applicatif consiste en une interface graphique (atelier).

SAS Data Integration Studio est une offre sur la brique ETL de la chaîne décisionnelle. L'atelier permet de concevoir un ensemble de tâches pour la création d'un système d'information.

SAS Web Report Studio permet de concevoir un ensemble de reporting accessible par le Web.

Exemples de code SAS

L'étape DATA suivante fait une copie du data set "origine" vers "copie" en ne prenant que les observations qui répondent à la clause WHERE :

 DATA copie;
 SET origine;
 WHERE vente > 100000;
 RUN;

L'étape se comprend de la façon suivante :

CREE LA TABLE copie ;
EN LISANT origine;
OÙ LES VENTES SONT SUPERIEURES à 100000;
EXECUTE;


La procédure suivante exporte les données vers un fichier xls :

 PROC EXPORT DATA=Copie
 OUTFILE= "C:\temp\copie.xls"
 DBMS=EXCEL REPLACE;
 SHEET="NomDeLaSheet";
 RUN;

La macro suivante optimise la procédure d'import en important du même fichier xls les feuilles vente1, vente2, vente3 et vente4 :

 %macro brol(max);
 %do i=1 %to max;
 PROC IMPORT OUT= WORK.origine 
            DATAFILE= "U:\temp\origine.xls" 
            DBMS=EXCEL REPLACE;
     SHEET="vente&i"; 
     GETNAMES=YES;
     MIXED=YES;
     SCANTEXT=YES;
     USEDATE=YES;
     SCANTIME=YES;
 RUN;
 %end;
 %mend;
 %brol(4)

Voir aussi

Lien interne

Liens externes

Ce document provient de « SAS (langage) ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Statistical Analysis System de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Statistical Analysis System — SAS Institute Unternehmensform Corporation Gründung 1976 Unternehmenssitz …   Deutsch Wikipedia

  • Statistical Analysis Center — Statistical Analysis Centers (SACs) are state agencies created by legislation or Executive Order that collect, analyze, and disseminate criminal and juvenile justice data. They contribute to effective state policies through statistical services,… …   Wikipedia

  • Statistical inference — In statistics, statistical inference is the process of drawing conclusions from data that are subject to random variation, for example, observational errors or sampling variation.[1] More substantially, the terms statistical inference,… …   Wikipedia

  • Analysis of variance — In statistics, analysis of variance (ANOVA) is a collection of statistical models, and their associated procedures, in which the observed variance in a particular variable is partitioned into components attributable to different sources of… …   Wikipedia

  • Statistical classification — See also: Pattern recognition See also: Classification test In machine learning, statistical classification is the problem of identifying the sub population to which new observations belong, where the identity of the sub population is unknown, on …   Wikipedia

  • Statistical database — A statistical database is a database used for statistical analysis purposes. It is an OLAP instead of OLTP system, although this term precedes that modern decision, and classical statistical databases are often closer to the relational model than …   Wikipedia

  • Statistical arbitrage — In the world of finance and investments statistical arbitrage is used in two related but distinct ways:* In academic literature, statistical arbitrage is opposed to (deterministic) arbitrage. In deterministic arbitrage a sure profit can be… …   Wikipedia

  • SAS System — Infobox Software name = SAS caption = SAS 9 on Microsoft Windows developer = SAS Institute latest release version = 9.2 latest release date = March, 2008 operating system = Windows, IBM mainframe, Unix/Linux, OpenVMS Alpha genre = numerical… …   Wikipedia

  • Michigan Terminal System — (MTS) The MTS welcome screen as seen through a 3270 terminal emulator. Company / developer University of Michigan and 7 other universities in the US, Canada, and the UK …   Wikipedia

  • Statistical semantics — is the study of how the statistical patterns of human word usage can be used to figure out what people mean, at least to a level sufficient for information access (Furnas, 2006). How can we figure out what words mean, simply by looking at… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”