时间:2021-07-01 10:21:17 帮助过:13人阅读
输出数组 [ 'python', 'javascript', 'jsonp' ]
这个问题想了比较久,也没思路
我的解法是
var result = str.match(/\b\w*(?=p)\w*\b/g)
.filter((value)=>!/.*(?=ph)/.test(value))
var result2 = str.match( /\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g )
console.log(result2)
但是不符合纯正则的要求
群里有大牛给了这么一个答案
/\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g
完美运行
但是我看不懂,希望有大牛能帮我解读
问题: 有字符串:“python php ruby javascript jsonp perhapsphpisoutdated”
对于该字符串,使用纯正则获取 所有带p 但是不能包含ph 的单词
输出数组 [ 'python', 'javascript', 'jsonp' ]
这个问题想了比较久,也没思路
我的解法是
var result = str.match(/\b\w*(?=p)\w*\b/g)
.filter((value)=>!/.*(?=ph)/.test(value))
var result2 = str.match( /\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g )
console.log(result2)
但是不符合纯正则的要求
群里有大牛给了这么一个答案
/\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g
完美运行
但是我看不懂,希望有大牛能帮我解读
var str = 'python php ruby javascript jsonp perhapsphpisoutdated';
var reg = /\b(\w*(p[^h\s](?!ph))\w*)\b/g;
str.match(reg);
// => ["python", "javascript", "perhapsphpisoutdated"]
\b为边界字符,范围为\w和\W之间的字符。
()标识的是子表达式。
(?!)标识的是反向先行断言,和子表达式不同是先行断言并不会被记录。
[^]标识的是取不满足条件的集合
所以上面的正则意思为取边界之间的含有『p』但是后面紧跟的字符串不是『h』或『空格』,同时后面也不含有『ph』的字符串
\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g\b 是边界字符
所以每一个单词对应的匹配是:((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)
把这个表达式拆成三部分:
((?!ph|\s).)*
(p[^h\s]((?!ph|\s).)*)
p
表达式里出现最多的是 ((?!ph|\s).)* 我们来分析一下
《javascript权威指南》里讲:
(?!p)是零宽度负向先行断言,表示接下来的字符不与p匹配
这里的 零宽度 是指 它本身不占用匹配:
可能这一点比较难理解,举个例子,比如:
计算"1234".match(/((?!34).)*/)的值
第一次(?!34)之前没有东西、忽略,只对.进行匹配,匹配到"1",字符串剩余"234"
对"234"进行匹配,测试"23"是否匹配?!里的"34",结果不匹配,继续进行,"23"没有被消耗,接下来的.匹配到"2",
对"34"进行匹配,由于"34"匹配?!里的"34",匹配终止
整个表达式的匹配结果是"12"
结论:
/((?!p).)*/形式的表达式匹配到的字符串是p之前的部分
这里再来看之前的三个表达式:
((?!ph|\s).)*
(p[^h\s]((?!ph|\s).)*)
p
第一个表达式表示匹配单词中 "ph" 或 空格之前的尽量长的字符
第二个表达式匹配单词中 "p" 及之后的字符,要求 "p" 之后的第一个字符不能为 "h",并且同样要求不匹配到 "ph"
第三个表达式匹配 单独的 "p" 字符,因为之前的匹配中最短能匹配到的形式是 p[^h\s],至少为两个字符,而单个"p"字符楼主的要求但未被包括在内,所以单独匹配
梳理一下就会发现,上面的匹配的三个表达式都不匹配 "ph", 但其中一定会有 "p",完全符合题主的要求