2. Analyse lexicographique
Le texte du programme source fourni par l’utilisateur est vu par le compilateur comme une suite de caractères. On y retrouve les symboles terminaux introduits précédemment, sous la forme de caractères uniques comme « + » ou « ( », ou de groupes de caractères comme « = » suivi de « = » pour le symbole d’égalité = =, ou « e » suivi de « l » suivi de « s » suivi de « e » qui représente le mot réservé else.
L’utilisateur écrit également dans son texte source des symboles qui ne sont pas prédéfinis dans le langage : des identificateurs de variables comme « somme » ou « TOTAL », des constantes comme 1995, des chaînes de caractères comme « la compilation, c’est facile !». Le texte source peut même comprendre des entités sans utilité pour le compilateur mais intéressantes pour la lecture ou la présentation du programme : citons les commentaires (par exemple dans le langage C, tout texte compris entre les symboles « / * » et « * / ») ou des espaces, des tabulations, des lignes vides.
Le rôle...
La suite de cet article est réservée aux abonnés
Vous n'êtes pas abonné ?
Consultez gratuitement cet article.
votre période de consultation gratuite
Découvrez le plus important corpus scientifique et technique francophone
Plus de 8 000 articles, 13 univers, 400 bases documentaires, les plus grands auteurs, un enrichissement permanent et un éventail de services associés.
