正则表达式

当前位置:正则表达式 > 正则

正则表达式?:和?=的区别

?:是忽略分组,也就是说括号内的内容不是一个group,包括在实际匹配
?=表示其后必须存在的内容,是一个条件,不是实际匹配中的内容
直接上例子:每三个数字中间加逗号
"123456789".replace(/(\d{3})(?:[^$])/g, "$1,");
//"123,567,9"

"123456789".replace(/(\d{3})(?=[^$])/g, "$1,");
//"123,456,789"
再上一个之前论坛里出现过的例子,也是每三个数字中间加逗号
先看看 (?=pattern) 的使用,下面这个是正确的:

function groupByCommas(n) {
  return n.toString().replace(/\B(?=(\d{3})+(?!\d))/g, ",");
}
console.log(groupByCommas(1234567));    //1,234,567

如果我们把 ?= 换成 ?: 的话:
function groupByCommas(n) {
  return n.toString().replace(/\B(?:(\d{3})+(?!\d))/g, ",");
}
console.log(groupByCommas(1234567));    //1,
两者的概念不用多说,查到有回答说:区别在于 ?= 是正向肯定 断言,进行的匹配是不占查询长度的;而 ?: 是非获取匹配,进行的匹配是占据查询长度的。
但是还是不是很理解这里的查询占据长度的说法,对着例子解释,难道是说第一个例子(?=[^$])匹配的是非结尾,所以123之后的非结尾的长度最小是1个字符,所以把4给一起替代了?那怎么不直接替代到结尾呢? 第二个例子(?=(\d{3})+(?!\d))匹配的是3或3的倍数个数字,直接匹配到了结尾,所以把234567也直接替代了?所以我的理解肯定是不对的




例如,我们通过一个函数把一个 number 类型的数字转换成一个字符串,并且每三位给他加上一个 ',';
1999 -> 1,999
先看看 (?=pattern) 的使用,下面这个是正确的:
function groupByCommas(n) { return n.toString().replace(/\B(?=(\d{3})+(?!\d))/g, ","); } console.log(groupByCommas(1234567)); //1,234,567
如果我们删掉(\d{3})后面的 '+'的话,全局标志依然还在,但是这个时候,就只能匹配字符串中的部分了。
function groupByCommas(n) { return n.toString().replace(/\B(?=(\d{3})(?!\d))/g, ","); } console.log(groupByCommas(1234567)); //1234,567
我的看法是这样的:
正则表达式等价于
/\B(?=(\d{3}){1}(?!\d))/g
所以当匹配到匹配项的时候,index 的位置已经到了4与5之间,而前面的正则是通过
/\B(?=(\d{3}){1}(?!\d))/g
/\B(?=(\d{3}){2}(?!\d))/g
匹配。
最后如果我们把 ?= 换成 ?: 的话:
function groupByCommas(n) { return n.toString().replace(/\B(?:(\d{3})+(?!\d))/g, ","); } console.log(groupByCommas(1234567)); //1,
 

相关文章
苏ICP备2022026517号-2  |   苏公网安备 32081202000316号
淮安先皓网络科技有限公司 © 版权所有  联系我们