Sintaxe de expressão regular
Para obter mais informações sobre a sintaxe de expressão regular, consulte Open Group Base Specifications Issue 6, Capítulo 9 aqui: http://pubs.opengroup.org/onlinepubs/007904875/basedefs/xbd_chap09.html. . Se quiser testar os resultados de correspondência para sua expressão antes de usá-la em seu fluxo de trabalho, você pode localizar muitos utilitários gratuitos na Web. Por exemplo, esta é uma ferramenta de teste de expressão baseado no navegador: http://gskinner.com/RegExr/.
Resumo da sintaxe
- Ponto (.) corresponde a uma única ocorrência de qualquer caractere (letra ou número).
- Asterisco (*) corresponde a zero ou mais ocorrências do caractere precedente, até o comprimento máximo do nome do arquivo
- Barra invertida (\) é o caractere de escape que significa que o próximo caractere será interpretado literalmente.
- Sinal de dólar ($) significa que uma correspondência significa o final da expressão.
- Ponto de interrogação (?) torna o token precedente opcional; por exemplo, colou?r corresponderia a color ou colour.
- O sinal de mais (+) corresponde a um ou mais dos tokens precedentes.
Os caracteres no valor fazem distinção entre maiúsculas e minúsculas. Por exemplo, .*PDF$,.*AFP$ representa padrões que são diferentes de .*pdf$,.*afp$.
Separe vários padrões com vírgulas; não digite espaços entre eles.
Observe que embora você geralmente veja *. usado como um termo correspondente (por exemplo, ao procurar arquivos em um sistema Windows), essa sequência de caracteres não é uma sintaxe de expressão regular válida.
Esse é um exemplo de expressão regular que usa os primeiros quatro caracteres alfanuméricos do nome do arquivo:
[A-Za-z0-9]{4}
O padrão entre colchetes, [A-Za-z0-9], corresponde a quaisquer caracteres nos intervalos A–Z, a–z ou 0–9. O número em colchetes, {4}, indica o número de caracteres a ser utilizado.