Регулярное выражение описывает образец символов. Регулярные выражения обычно используются для проверки соответствия текстового значения определенному образцу (как, например, проверка наличия в телефонном номере, набранном пользователем, правильного числа цифр) или для замены частей текстового значения, соответствующих определенному образцу.
Регулярные выражения могут быть простыми. Например, предположим, что требуется подтвердить, что определенная строка соответствует «ABC», или заменить каждое появление в строке «ABC» другим текстом. В этом случае можно использовать следующее регулярное выражение, определяющее образец, состоящий из букв A, B и C, следующих друг за другом:
/ABC/
Следует отметить, что литерал регулярного выражения отделяется символом прямой косой черты
/
.
Образцы регулярных выражений также могут быть сложными и иногда имеют зашифрованный вид, как, например, у следующего выражения, что в данном случае необходимо для подбора допустимого адреса электронной почты:
/([0-9a-zA-Z]+[-._+&])*[0-9a-zA-Z]+@([-0-9a-zA-Z]+[.])+[a-zA-Z]{2,6}/
Чаще всего регулярные выражения используются для поиска образцов в строках и замены символов. В таких случаях создается объект регулярного выражения и используется в качестве параметра для одного или нескольких методов класса String. Следующие методы класса String используют регулярные выражения в качестве параметров:
match()
,
replace()
,
search()
и
split()
. Дополнительные сведения об этих методах см. в разделе «
Поиск шаблонов в строках и замена подстрок
».
Класс RegExp включает следующие методы:
test()
и
exec()
. Дополнительные сведения см. в разделе «
Методы для использования регулярных выражений со строками
».
Важные понятия и термины
Ниже приводится список важных терминов, относящихся к этой функции.
-
Символ перехода
-
Символ, указывающий на то, что последующий символ должен рассматриваться как метасимвол, а не как символ литерала. В синтаксисе регулярного выражения символом перехода является обратная косая черта (\), поэтому обратная косая черта, после которой идет другой символ, является особым кодом, а не просто символом.
-
Флаг
-
Символ, указывающий вариант использования образца регулярного выражения, как, например, необходимость в различии между символами верхнего и нижнего регистров.
-
Метасимвол
-
Символ, имеющий особое значение в образце регулярного выражения в отличие от буквального представления данного символа в образце.
-
Квантификатор
-
Символ (или несколько символов), указывающий число повторений части образца. Например, квантификатор может использоваться для обозначения того, что почтовый индекс Соединенных Штатов должен содержать пять или девять чисел.
-
Регулярное выражение
-
Инструкция программы, определяющая образец символов, используемый для подтверждения совпадения других строк данному образцу или для замены частей строки.