正则表达式的魔力源于它可以在模式中拥有选择和重复的能力。 一些字符被赋予 特殊的涵义,使其不再单纯的代表自己,模式中的这种有特殊涵义的编码字符 称为 元字符。
共有两种不同的元字符:一种是可以在模式中方括号外任何地方使用的,另外一种 是需要在方括号内使用的。 在方括号外使用的元字符如下:
| 元字符 | 描述 |
|---|---|
| \ | 一般用于转义字符 |
| ^ | 断言目标的开始位置(或在多行模式下是行首) |
| $ | 断言目标的结束位置(或在多行模式下是行尾) |
| . | 匹配除换行符外的任何字符(默认) |
| [ | 开始字符类定义 |
| ] | 结束字符类定义 |
| | | 开始一个可选分支 |
| ( | 子组的开始标记 |
| ) | 子组的结束标记 |
| ? | 作为量词,表示 0 次或 1 次匹配。位于量词后面用于改变量词的贪婪特性。 (查阅量词) |
| * | 量词,0 次或多次匹配 |
| + | 量词,1 次或多次匹配 |
| { | 自定义量词开始标记 |
| } | 自定义量词结束标记 |
| 元字符 | 描述 |
|---|---|
| \ | 转义字符 |
| ^ | 仅在作为第一个字符(方括号内)时,表明字符类取反 |
| - | 标记字符范围 |