# 正则表达式
RegExp
对象表示正则表达式,它是对字符串执行模式匹配的强大工具。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑
它描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
有一定难度,不要求非常熟练,但至少会表单验证
# 正则表达式的特点是:
- 灵活性、逻辑性和功能性非常的强;
- 可以迅速地用极简单的方式达到字符串的复杂控制。
- 对于刚接触的人来说,比较晦涩难懂。
- 就算会写,写的过程没问题,写完再看几乎不认识。
比如: 匹配国内电话号码: /\d{3}-\d{8}|\d{4}-\d{7}/ 验证手机号: /^((13[0-9])|(15,[^4,\D])|(18[0,5-9]))\d{8}$/
很难记住
# 创建方式
- 字面量形式创建
/pattern/attributes
- 构造函数的方式创建
new RegExp(pattern, attributes);
参数
pattern
是一个字符串,指定了正则表达式的模式或其他正则表达式。参数
attributes
是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果pattern
是正则表达式,而不是字符串,则必须省略该参数。
// 1. 字面量形式创建 /pattern/attributes
var reg = /a/gi;
// 2. 构造函数的方式创建 new RegExp(pattern, attributes);
var reg = new RegExp("^a", "gm");
var str = "ab AB1Ab\naB1239ab";
// 3. 构造函数复制之前的正则对象
var reg1 = new RegExp(reg); // 创建一个新的地址,然后保存值
var reg2 = RegExp(reg); // 拷贝的是一个地址
# 使用方式
reg.test(str); // 检验字符串是否有符合正则条件的字符串片段,返回 true/false
reg.exec(str); // 检索字符串中指定的值。返回找到的值,并确定其位置
str.match(reg); // 返回符合正则表达式的字符串片段
reg.lastIndex
(可读写) 标示开始下一次匹配的字符位置 跟reg.exec()
协调使用
var str = "abababa";
var reg = /ab/g;
console.log(reg.exec(str));
console.log(reg.lastIndex);
console.log(reg.exec(str));
console.log(reg.lastIndex);
console.log(reg.exec(str));
console.log(reg.lastIndex);
// 也可以手动设置 lastIndex
reg.lastIndex = 0;
console.log(reg.lastIndex);
console.log(reg.exec(str));
console.log(reg.lastIndex);
// 正则表达式reg中不写 g 属性,exec只返回匹配到的第一次的子串及下标
# 组合 []
表达式 | 介绍 |
---|---|
[adgk] | 查找给定集合内的任何字符。 |
[0-9] | 查找任何从 0 至 9 的数字。 |
[a-z] | 查找任何从小写 a 到小写 z 的字符。 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符。 |
[A-z] | 查找任何从大写 A 到小写 z 的字符。 |
# 边界
- ^ 以什么开头 /^a/.test("ba")
- $ 以什么结尾 /a$/.test("ba")
- 注意:^在[]中表示 非 例如:/[^a]/.test("b")
# 量词
* 重复零次或更多 >=0
+ 重复一次或更多次 >=1
? 重复零次或一次 (0 || 1) /[a-z]?/.test("aa")
{n} n 次 (x=n) /[1-9]{5}/.test("1234")
{n,} 重复 n 次或更多 (x>=n) "a123b4567".match(/[0-9]{2,}/g)
{n,m} 重复出现的次数比 n 多但比 m 少 (n<=x<=m) /[0-9]{3,5}/.test("a123bcd")
x|y x 或者 y
() 完全匹配 "abcdebfg".match(/(ab|bf)c/g)
/a{1,3}?/ 能取 1 个不取三个 ?加在量词之后表示打破贪婪匹配,能取少,不取多
"aaaabbbaaaaaaaaabbaaaa".match(/a{3,5}/g); // log: ["aaaa", "aaaaa", "aaaa", "aaaa"] "aaaaaaaaaaaaaaaaa".match(/a+/g); // log: ["aaaaaaaaaaaaaaaaa"] "aaaaaaaaaaaaaaaaa".match(/a+?/g); // log: ["a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a"] "aaaabbbaaaaaaaaabbaaaa".match(/a{3,5}?/g); // log: ["aaa", "aaa", "aaa", "aaa", "aaa"]
# 元字符
名称 | 含义 |
---|---|
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找单词字符。 |
\W | 查找非单词字符。 |
\d | 查找数字。 |
\D | 查找非数字字符。 |
\s | 查找空白字符。 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
注意:\b 和 \B 是根据方向存在的
题目:
- 写一个正则表达式,检验字符串首尾是否是数字?检验首尾是否都是数字? 答: /^\d|\d$/ 和 /^\d[\w\W]*\d$/
- 校验 1-200 的整数 答: /^(1\d{2}|[1-9]\d?|200)$/
- 电话号码验证: 以 13/15/18(0-9) 或 145/147/149 或 166 或 17(0-8) 或 198/199 开头后面跟任意 8 个数字 答: /^1([358]\d|4[579]|66|7[0-8]|9[89])\d{8}$/