awk

awk: Pour les articles homonymes, voir Awk (homonymie).

awk — dont le nom vient des trois créateurs, Alfred Aho, Peter Weinberger et Brian Kernighan — est un langage de traitement de lignes, disponible sur la plupart des systèmes Unix et sous Windows avec Cygwin ou Gawk. Il est principalement utilisé pour la manipulation de fichiers textuels pour des opérations de recherches, de remplacement et de transformations complexes.

Sommaire

1 Présentation

2 Description technique

3 Quelques exemples

4 Implémentation

5 Voir aussi

5.1 Articles connexes

5.2 Liens externes

5.3 Bibliographie

Présentation

Awk est le plus souvent utilisé pour la production de fichiers plats aux spécifications particulières (échanges entre différents systèmes d'informations hétérogènes). Il est aussi utilisé comme "parser" de fichiers XML ou de fichiers textes pour générer des commandes SQL à partir des données extraites. Il peut être utilisé aussi pour des opérations de calculs complexes et mise en forme de données brutes pour faire des tableaux statistiques.

On distingue awk, la commande originale, du new awk (nawk), arrivée un peu plus tard sur le marché. Les implémentations GNU de awk, sont en fait des new awk. On trouve en général la commande awk dans /usr/bin sous Unix. Certains systèmes GNU/Linux le mettent dans /bin. En général, elle est dans la variable d'environnement PATH. Cependant, on peut faire des scripts en awk et le shebang (#!/usr/bin/awk -f) devient faux. Le script est donc inutilisable si le binaire n’est pas là où on l’attend.

Il agit comme un filtre programmable prenant une série de lignes en entrée (sous forme de fichiers ou directement via l'entrée standard) et écrivant sur la sortie standard, qui peut être redirigée vers un autre fichier ou programme. Un programme Awk est composé de trois blocs distincts utilisables ou non pour le traitement d'un fichier (prétraitement, traitement, posttraitement). Awk lit sur l'entrée ligne par ligne, puis sélectionne (ou non) les lignes à traiter par des expressions rationnelles (et éventuellement des numéros de lignes). Une fois la ligne sélectionnée, elle est découpée en champs selon un séparateur d'entrée indiqué dans le programme awk par le symbole FS (qui par défaut correspond au caractère espace ou tabulation). Puis les différents champs sont disponibles dans des variables : $1 (premier champ), $2 (deuxième champ), $3 (troisième champ), ..., $NF (dernier champ).

« awk » est aussi l'extension de nom de fichier utilisée pour les scripts écrits dans ce langage (rarement utilisée).

La syntaxe est inspirée du C :
awk [options] [programme] [fichier]
où la structure du programme est :
'motif1 { action1 } motif2 { action2 } ...'
Chaque ligne du fichier est comparée successivement aux différents motifs (le plus souvent des expressions rationnelles, et globalement une expression booléenne) et l'action du premier motif renvoyant la valeur vraie est exécutée. Dans ce cas, ou si aucun motif n'est accepté, le programme lit la ligne suivante du fichier et la compare aux motifs en partant du premier.

Quelques options :

-F séparateur : permet de modifier le séparateur de champs ;

-f fichier : lit le programme à partir d'un fichier.

-v awkVar=$shellVar : Permet de facilement intégrer des variables du shell dans le code awk.

Description technique

Un fichier est divisé en lignes (records en anglais) elles-mêmes divisées en champs (fields en anglais)

lignes : séparateur <newline> ; compteur NR.

champs : séparateur espace ou tabulation ; compteur NF.

Les séparateurs d'entrée-sortie sont stockés dans des variables et peuvent être modifiés :

lignes : variables RS et ORS

champs : variables FS et OFS

Pour retourner le n^e champ :

$n où n est un entier strictement positif ;

$0 retourne la ligne entière.

Deux masques spéciaux :

BEGIN : définit un programme avant de commencer l'analyse du fichier ;

END : définit un programme après l'analyse.

Pour définir un intervalle, on utilise la virgule comme ceci :

NR == 1, NR == 10 : l'action associée sera appliquée aux lignes 1 à 10.

Plusieurs fonctions sont déjà implémentées :

print, printf : fonctions d'affichage ;

cos(expr), sin(expr), exp(expr), log(expr) ;

getline() : lit l'entrée suivante d'une ligne, retourne 0 si fin de fichier (EOF : end of file), 1 sinon ;

index(s1, s2) : retourne la position de la chaîne s2 dans s1, retourne 0 si s2 ne figure pas dans s1 ;

int(expr) : partie entière d'une expression ;

length(s) : longueur de la chaîne s ;

substr(s,n,l) : retourne une partie de la chaine de caractères s commençant à la position n, et d'une longueur l.

Structures de contrôles : la syntaxe provient directement du C :

if (test) {actions} else {actions}

while (test) {actions}

do {actions} while (test)

for (expr1;expr2;expr3) {actions}

continue : passe à l'élément suivant dans une boucle

break : sort d'une boucle

Par rapport au C il y a quelques extensions :

continue : hors d'une boucle, passe au motif suivant.

next : passe à la ligne suivante

tableaux assocatifs : tableau[texte]=valeur

for (var in tableau) {actions}

Quelques exemples

awk '{print $0}' fichier : affiche toutes les lignes de fichier (idem que cat fichier).

awk '/2/ {print $0}' ref.txt : affiche toutes les lignes où le caractère 2 est présent (idem que grep '2' ref.txt).

awk '$1~/2/ {print $0}' ref.txt : affiche toutes les lignes où le caractère 2 est présent dans le premier champ.

awk '{print NR ":", $0}' fichier : affiche le contenu de fichier, mais chaque ligne est précédée de son numéro.

awk -F : '{print $1}' /etc/passwd : renvoie la liste des utilisateurs (idem cut -d : -f 1 /etc/passwd).

awk 'BEGIN {FS = ":"}{print $1}' /etc/passwd : idem que la précédente commande

awk '{s=s+$1} END {print s}' fichier : écrit la somme de tous les nombres de la première colonne de fichier.

awk '/Motif1/ , /Motif2/' fichier : écrit toutes les lignes contenues dans le fichier entre le Motif1 et le Motif2.

Implémentation

Il existe divers programmes qui utilisent la syntaxe du awk original, voici les plus connus :

nawk (abréviation de new awk) qui étend les fonctionnalités de la version initiale ;

mawk une version connue pour sa rapidité dans certains cas ;

gawk la version du GNU disponible sous les principaux OS, avec une modification qui existe pour travailler sur le réseau TCP/IP ;

jawk une version fonctionnant sur la machine virtuelle Java.

Voir aussi

Sed, un autre processeur de fichier, spécialisé dans le traitement de fichiers textes non organisés, basé sur la correspondance de motifs (en anglais, "pattern matching") et non sur les colonnes et les lignes.

Articles connexes

GNU Awk

Liens externes

(en) Awk feuille de triche

(en) Page man de awk

Bibliographie

Alfred V. Aho, Peter J. Weinberger et Brian W. Kernighan (1985), AWK Langage de programmation, ISBN 2-87908-110-6

Pour plus d'informations Shellunix.com

v · d · m

Commandes Unix

Aide arch · apropos · cal · date · help (en) · file · history · info · man · type · uname · whatis

Environnement utilisateur env · dmesg · finger · halt · id · init · logname · mesg · passwd · reboot · shutdown · su · sudo · uptime · w · wall · who · whoami · write

Gestion de processus at · bg · chroot · crontab · exit · fg · kill · lp · lpr · nice · pkill · ps · pstree · sleep · time · top

Manipulation de texte awk (gawk) · banner · bash · bc · cat · clear · cut · ed · head · join · nl · read · sed · sort · strings · tail · tee · tr · uniq · vi · vim · wc

Programmation shell alias · basename · dirname · echo · expr · false · printf · test · true · unset

Recherche find · grep · locate · whereis · which

Réseau ethtool · ftp · host · mail · mii-tool · nc · netstat · ping · rlogin · ssh · sftp · telnet · traceroute · ifconfig

Système de fichiers cd · chgrp · chmod · chown · cp · dd · dir · du · df · file · less · ln · ls · lsof · mkdir · more · mount · mv · pwd · rm · rmdir · touch · umask · umount

Portail de la programmation informatique

Catégories :
Langage de programmation
Langage de script

Contenu soumis à la licence CC-BY-SA. Source : Article awk de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

AWK — Información general Paradigma Programación dirigida por eventos, Programación imperativa Apareció en 1977, última revision 1985, la versión POSIX actual es IEEE Std 1003.1 2004 … Wikipedia Español
awk — ist eine Programmiersprache (Skriptsprache) zur Bearbeitung und Auswertung strukturierter Textdaten, beispielsweise CSV Dateien. Der zugehörige Interpreter war eines der ersten Werkzeuge, das in der Version 3 von Unix erschien; es wird auch… … Deutsch Wikipedia
Awk — Pour les articles homonymes, voir Awk (homonymie). awk dont le nom vient des trois créateurs, Alfred Aho, Peter Weinberger et Brian Kernighan est un langage de traitement de lignes, disponible sur la plupart des systèmes Unix et sous Windows avec … Wikipédia en Français
AWK — Класс языка: скриптовый, процедурный, событийно ориентированный Появился в: 1977 Автор(ы): Альфред Ахо, Питер Вайнбергер и Брайан Керниган Релиз … Википедия
AWK — es un lenguaje de programación de propósito general que fue diseñado para procesar datos basados en texto, ya sean ficheros o flujos de datos. El nombre AWK deriva de los apellidos de los autores: Alfred V. Aho, Peter J. Weinberger, y Brian W.… … Enciclopedia Universal
Awk — ([add]k), a. [OE. auk, awk (properly) turned away; (hence) contrary, wrong, from Icel. [ o]figr, [ o]fugr, afigr, turning the wrong way, fr. af off, away; cf. OHG. abuh, Skr. ap[=a]c turned away, fr. apa off, away + a root ak, a[u^]k, to bend,… … The Collaborative International Dictionary of English
awk — awk·ward; awk·ward·ly; awk·ward·ness; awk; … English syllables
Awk — Awk, adv. Perversely; in the wrong way. L Estrange. [1913 Webster] … The Collaborative International Dictionary of English
AWK — [Abk. für Aho, Weinberger, Kernighan (die Namen der Entwickler)], eine 1977 entwickelte einfache Programmiersprache, die es ermöglicht unter Unix Textdateien nach bestimmten Textmustern zu durchsuchen und nach zuvor festgelegten Kriterien zu… … Universal-Lexikon
awk — (adj.) mid 15c., turned the wrong way, from O.N. afugr turned backwards, wrong, contrary, from P.Gmc. *afug , from PIE *apu ko , from root *apo off, away (see APO (Cf. apo )). Obsolete since 17c … Etymology dictionary
AWK — (Aho Weinberger Kernighan) programming language included with the UNIX operating system that is designed for processing text files (the name is made from the initials of the three inventors) … English contemporary dictionary

Dictionnaires et Encyclopédies sur 'Academic'

awk

Sommaire

Présentation

Description technique

Quelques exemples

Implémentation

Voir aussi

Articles connexes

Liens externes

Bibliographie

Regardez d'autres dictionnaires:

Share the article and excerpts

v · d · m Commandes Unix
Aide	arch · apropos · cal · date · help (en) · file · history · info · man · type · uname · whatis
Environnement utilisateur	env · dmesg · finger · halt · id · init · logname · mesg · passwd · reboot · shutdown · su · sudo · uptime · w · wall · who · whoami · write
Gestion de processus	at · bg · chroot · crontab · exit · fg · kill · lp · lpr · nice · pkill · ps · pstree · sleep · time · top
Manipulation de texte	awk (gawk) · banner · bash · bc · cat · clear · cut · ed · head · join · nl · read · sed · sort · strings · tail · tee · tr · uniq · vi · vim · wc
Programmation shell	alias · basename · dirname · echo · expr · false · printf · test · true · unset
Recherche	find · grep · locate · whereis · which
Réseau	ethtool · ftp · host · mail · mii-tool · nc · netstat · ping · rlogin · ssh · sftp · telnet · traceroute · ifconfig
Système de fichiers	cd · chgrp · chmod · chown · cp · dd · dir · du · df · file · less · ln · ls · lsof · mkdir · more · mount · mv · pwd · rm · rmdir · touch · umask · umount

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

awk

Sommaire

Présentation

Description technique

Quelques exemples

Implémentation

Voir aussi

Articles connexes

Liens externes

Bibliographie

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link