簡數(shù)采集器正則表達式功能:用戶可使用正則表達式提取或者替換匹配內(nèi)容;
簡數(shù)采集器將一些常用的正則表達式列出,方便用戶使用:日期,中文日期,正整數(shù),負整數(shù),正浮點數(shù),負浮點數(shù),網(wǎng)址URL,Email,IP和身份證號。
雙擊采集的字段或者字段右邊的綠色設(shè)置按鈕進入數(shù)據(jù)處理==》轉(zhuǎn)到 “日期等正則提取” 欄目;
1. 字段原值:采集內(nèi)容顯示區(qū),可與最下方的 “字段處理后值” 作對比;
2. 常用表達式:點擊該處的按鈕,會出現(xiàn)相應(yīng)的正則表達式;
3. 將匹配的內(nèi)容:可填寫要替換的字符串或正則表達式;(該處會匹配原值中符合條件的所有內(nèi)容)
4. 替換為:如果不填,匹配的內(nèi)容會替換原值;
如果填寫了,匹配的內(nèi)容會被填寫的值替換,原值其他內(nèi)容保持不變;(例子見下方結(jié)果)
5. 正則捕獲組:使用捕獲語法提取匹配內(nèi)容,該處只能提取不能替換;(該處正則只會匹配原值中符合的第一個內(nèi)容)
6. 多組值分隔符:如果正則捕獲組有多個,填寫的值會作為多個捕獲組間的分隔符;(例子見下方中文日期)
PS:如果不填,則無分隔符;
7. 字段處理后值:該處為正則匹配內(nèi)容處理后的結(jié)果值,根據(jù)配置可分三種情況:
——顯示提取匹配的內(nèi)容;
——顯示原值替換匹配內(nèi)容后的結(jié)果值;
——無匹配到任何內(nèi)容,為空;
1. 日期
2. 中文日期
3. 網(wǎng)址URL
4. Email
5. 正則替換