123,123,123

　阿里云優(yōu)惠券先領(lǐng)券再下單

昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個不錯的表達(dá)式，因?yàn)榭梢詽M足我們的要求，所以這個表達(dá)式可用，但不一定是最好的

昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個不錯的表達(dá)式，因?yàn)榭梢詽M足我們的要求，所以這個表達(dá)式可用，但不一定是最好的。

從性能上來說，他非常糟糕，為什么這么說呢，因?yàn)?傳統(tǒng)型NFA引擎遇到分支是從左往右匹配的，

所以它會用 \\. 去匹配每一個字符，發(fā)現(xiàn)不對后才用 [^"] 去匹配。

比如這樣一個字符串: "123456\'78\"90"

共 16 個字符，除了第一個 " 直接匹配成功，還剩余 15 個，只有 2 個轉(zhuǎn)義(4 個字符)，所以 \\. 會失敗 10 次，只有 2 次成功。

這 10 次匹配失敗，需要回溯后用 [^"] 才能匹配成功，當(dāng)然最后一個 " 會直接匹配成功。

很明顯，正常的字符串不可能全是轉(zhuǎn)義，正常的字符串才是主流，當(dāng)然不排除有人故意全轉(zhuǎn)義的情況。

所以這個正則需要10次回溯后才能匹配完成，如果字符串增長到 1K 1M 腫么破呢？

所以我們要修改下這個正則，前后換下位置么？

js 中字符串用 \ 折行是允許的，但是修改后的正則沒法匹配這樣的字符串了，所以我們還得繼續(xù)修復(fù)。

因?yàn)?. 沒法匹配換行，所以我們要用其他方式表達(dá)。

. 是用于匹配除換行符之外的所有字符，難道我們要 [.\n] 來表示么？

這樣是不對的，因?yàn)?[] 字符集中的 . 不再表示除換行符之外的所有字符，而是字符 . 也就是他本身一個字符而已。

那怎么辦呢？

其實(shí)換個思路，

\d 表示 0-9

\D 表示 [^0-9]

那么 [\d\D] 就表示所有了，不是么。（新人朋友不知道能不能消化這個知識點(diǎn)。）

同理 [\s\S] [\w\W] 同樣可以。

所以 /"(?:[^"\\]|\\[\d\D])*"/ 這樣就滿足我們的要求了。

效果不錯。

回頭過來分分析下他現(xiàn)在的性能吧。

還是這個字符串: "123456\'78\"90" ，正則 /"(?:[^"\\]|\\[\d\D])*"/

共 16 個字符，除了第一個 " 直接匹配成功，還剩余 15 個，有 2 個轉(zhuǎn)義(4 個字符)，[^"\\] 能匹配成功 10 個字符，只有 2 次失敗。

為什么不是 4 次失敗呢，明明有4個字符啊。\\ 雖然是2個字符，但是讀到第一個 \ 就匹配失敗，然后用 \\[\d\D] 匹配成功，

占用掉了兩個字符 \\ 下次用下一個o開始匹配，所以只有2次回溯。

只有 2 次需要回溯，然后用 \\[\d\D] 匹配成功。當(dāng)然最后一個 " 還是會直接匹配成功。

所以從 10 次回溯，減少到了 2 次，雖然正則比昨天臃腫了很多，但至少性能提升了不止一個等級。

OK，今天的分享完畢，明天見。

來源：腳本之家

鏈接：https://www.jb51.net/article/184337.htm

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)文章

Eclipse使用正則表達(dá)式快速修改代碼的方法

這篇文章主要介紹了Eclipse使用正則表達(dá)式快速修改代碼的方法，本文給大家介紹的非常詳細(xì)，具有一定的參考借鑒價值,需要的朋友可以參考下

標(biāo)簽：

正則表達(dá)式

代碼設(shè)計
通過正則表達(dá)式驗(yàn)證IP和端口格式的正確性

這篇文章主要介紹了正則表達(dá)式驗(yàn)證IP和端口格式的正確性，本文給大家介紹的非常詳細(xì)，具有一定的參考借鑒價值,需要的朋友可以參考下

標(biāo)簽：

正則表達(dá)式
java正則表達(dá)式判斷前端參數(shù)修改表中另一個字段的值

這篇文章主要介紹了java正則表達(dá)式判斷前端參數(shù)修改表中另一個字段的值,需要的朋友可以參考下

標(biāo)簽：

正則表達(dá)式

java
使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法

這篇文章主要介紹了使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

標(biāo)簽：

正則表達(dá)式
js處理網(wǎng)頁編輯器轉(zhuǎn)義去除轉(zhuǎn)義去除HTML標(biāo)簽的正則

這篇文章主要介紹了富文本編輯器生成的HTML標(biāo)簽，進(jìn)行轉(zhuǎn)義，然后寫入數(shù)據(jù)庫，防止腳本注入,需要的朋友可以參考下

標(biāo)簽：

正則表達(dá)式

html

當(dāng)前位置：首頁 > 站長 > 編程技術(shù) > 正文

js 正則學(xué)習(xí)小記之匹配字符串字面量優(yōu)化篇

相關(guān)文章

Eclipse使用正則表達(dá)式快速修改代碼的方法

通過正則表達(dá)式驗(yàn)證IP和端口格式的正確性

java正則表達(dá)式判斷前端參數(shù)修改表中另一個字段的值

使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法

js處理網(wǎng)頁編輯器轉(zhuǎn)義去除轉(zhuǎn)義去除HTML標(biāo)簽的正則

熱門排行

信息推薦

編輯推薦

VS2019屬性管理器沒有Microsoft.Cpp.x64.user的解決辦法

JS頁面動態(tài)繪圖工具SVG，Canvas，VML介簡介

熱門標(biāo)簽

當(dāng)前位置：首頁 > 站長 > 編程技術(shù) > 正文

js 正則學(xué)習(xí)小記之匹配字符串字面量優(yōu)化篇

相關(guān)文章

Eclipse使用正則表達(dá)式快速修改代碼的方法

通過正則表達(dá)式驗(yàn)證IP和端口格式的正確性

java正則表達(dá)式判斷前端參數(shù)修改表中另一個字段的值

使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法

js處理網(wǎng)頁編輯器轉(zhuǎn)義 去除轉(zhuǎn)義 去除HTML標(biāo)簽的正則

熱門排行

信息推薦

編輯推薦

VS2019屬性管理器沒有Microsoft.Cpp.x64.user的解決辦法

JS頁面動態(tài)繪圖工具SVG，Canvas，VML介簡介

熱門標(biāo)簽

js處理網(wǎng)頁編輯器轉(zhuǎn)義去除轉(zhuǎn)義去除HTML標(biāo)簽的正則

JS頁面動態(tài)繪圖工具SVG，Canvas，VML介簡介