Syntaxe des expressions régulières
Pour plus d'informations sur la syntaxe des expressions régulières, consultez Open Group Base Specifications Issue 6, Chapter 9 ici : http://pubs.opengroup.org/onlinepubs/007904875/basedefs/xbd_chap09.html. Si vous souhaitez tester les résultats de correspondance de votre expression avant de l'utiliser dans votre flux de travaux, vous pouvez trouver de nombreux utilitaires gratuits sur le Web. Par exemple, voici un outil de test d'expression gratuit basé sur le navigateur : http://gskinner.com/RegExr/.
Récapitulatif de syntaxe
- Le point (.) correspond à une occurrence unique de n'importe quel caractère (lettre ou chiffre).
- L'astérisque (*) correspond à zéro ou plusieurs occurrences du caractère précédent (jusqu'à la longueur maximale du nom de fichier).
- La barre oblique inversée (\) correspond au caractère d'échappement qui indique que le caractère suivant est interprété littéralement.
- Le dollar ($) indique qu'une correspondance marque la fin de l'expression.
- Le point d'interrogation (?) rend facultatif l'indicateur qui précède ; par exemple, colou?r correspond à color ou colour.
- Le signe plus (+) correspond à un ou plusieurs des indicateurs précédents.
Les caractères sont sensibles à la casse. Par exemple, les valeurs .*PDF$,.*AFP$ et .*pdf$,.*afp$ ne correspondent pas aux mêmes masques.
Séparez les différents formats par des virgules (et non par un espace).
Notez que bien qu'il soit courant de voir *. utilisé comme terme de correspondance (par exemple, lors de la recherche de fichiers sur un système Windows), cette séquence de caractères ne constitue pas une syntaxe correcte des expressions régulières.
Ceci est un exemple d'expression régulière utilisant les quatre premiers caractères alphanumériques du nom de fichier :
[A-Za-z0-9]{4}
La chaîne entre crochets, [A-Za-z0-9], peut représenter n'importe quels caractères compris dans les plages A–Z, a–z ou 0–9. Le nombre entre accolades, {4}, spécifie le nombre de caractères à utiliser.