Uma expressão regular descreve um padrão de caracteres. As expressões regulares são normalmente usadas para verificar se um valor de texto está em conformidade com um determinado padrão (como a verificação para saber se o número de telefone digitado pelo usuário tem o número de dígitos adequado) ou para substituir partes de um valor de texto que corresponde a um determinado padrão.
As expressões regulares podem ser simples. Por exemplo, suponha que você queira confirmar se uma determinada string corresponde a "ABC" ou substituir cada ocorrência de "ABC" em uma string por algum outro texto. Nesse caso, você pode usar a seguinte expressão regular, que define o padrão composto pelas letras A, B e C em sequência:
/ABC/
Observe que o literal de uma expressão regular é delineado com o caractere de barra (
/
).
Os padrões de expressões regulares também podem ser complexos e, às vezes, críptico na aparência, como a expressão a seguir, para corresponder a uma endereço de email válido:
/([0-9a-zA-Z]+[-._+&])*[0-9a-zA-Z]+@([-0-9a-zA-Z]+[.])+[a-zA-Z]{2,6}/
Com mais frequência, você utilizará expressões regulares para pesquisar padrões em strings e substituir caracteres. Nesses casos, você criará um objeto de expressão regular e o usará como um parâmetro para um dos vários métodos da classe String. Os seguintes métodos da classe String usam as expressões regulares como parâmetros:
match()
,
replace()
,
search()
e
split()
. Para obter mais informações sobre esses métodos, consulte
Localização de padrões em sequências de caracteres e substituição de subsequências de caracteres
.
A classe RegExp inclui as seguintes opções:
test()
e
exec()
. Para obter mais informações, consulte
Métodos para usar expressões regulares com strings
.
Conceitos e termos importantes
A lista de referência a seguir contém termos importantes que são relevantes a este recurso:
-
Caractere Escape
-
Um caractere indicando que o caractere seguinte deve ser tratado como um metacaractere em vez de um caractere literal. Na sintaxe de expressões regulares, o caractere de barra invertida (\) é o caractere escape; portanto uma barra invertida seguida por outro caractere é um código especial e não apenas o próprio caractere.
-
Sinalizador
-
Um caractere que especifica algumas opções sobre como o padrão de expressão regular deve ser utilizado, como distinguir entre caracteres maiúsculos e minúsculos.
-
Metacaractere
-
Um caractere que tem um significado especial em um padrão de expressão regular, em oposição à representação literal do caractere no padrão.
-
Quantificador
-
Um caractere (ou vários) indicando quantas vezes uma parte do padrão deve se repetir. Por exemplo, um quantificador é utilizado para designar que o código postal dos Estados Unidos deve conter cinco ou nove números.
-
Expressão regular
-
Uma instrução do programa que define um padrão de caracteres que podem ser usados para confirmar se outras strings correspondem àquele padrão ou substituir partes de uma string.