上一篇文章 :: 下一篇文章 |
發表人 |
內容 |
Arnor 究極の素還尊
註冊時間: 2001-11-07 文章: 13011 來自: TAIWAN
|
發表於: 星期三 五月 12, 2004 5:55 pm 文章標題: [PCRE] PCRE 交流園地.. |
|
|
有鍵於很多人不懂PCRE,
我想就發表個主題給大家相互交流一下...
希望有助益.
\ Quote the next metacharacter
^ Match the beginning of the line
. Match any character (except newline)
$ Match the end of the line (or before newline at the end)
| Alternation
() Grouping
[] Character class
* Match 0 or more times
+ Match 1 or more times
? Match 1 or 0 times
{n} Match exactly n times
{n,} Match at least n times
{n,m} Match at least n but not more than m times
*? Match 0 or more times
+? Match 1 or more times
?? Match 0 or 1 time
{n}? Match exactly n times
{n,}? Match at least n times
{n,m}? Match at least n but not more than m times
\t tab (HT, TAB)
\n newline (LF, NL)
\r return (CR)
\f form feed (FF)
\a alarm (bell) (BEL)
\e escape (think troff) (ESC)
\033 octal char (think of a PDP-11)
\x1B hex char
\x{263a} wide hex char (Unicode SMILEY)
\c[ control char
\N{name} named char
\l lowercase next char (think vi)
\u uppercase next char (think vi)
\L lowercase till \E (think vi)
\U uppercase till \E (think vi)
\E end case modification (think vi)
\Q quote (disable) pattern metacharacters till \E
\w Match a "word" character (alphanumeric plus "_")
\W Match a non-"word" character
\s Match a whitespace character
\S Match a non-whitespace character
\d Match a digit character
\D Match a non-digit character
\pP Match P, named property. Use \p{Prop} for longer names.
\PP Match non-P
\X Match eXtended Unicode "combining character sequence",
equivalent to (?:\PM\pM*)
\C Match a single C char (octet) even under Unicode.
NOTE: breaks up characters into their UTF-8 bytes,
so you may end up with malformed pieces of UTF-8.
\b Match a word boundary
\B Match a non-(word boundary)
\A Match only at beginning of string
\Z Match only at end of string, or before newline at the end
\z Match only at end of string
\G Match only at pos() (e.g. at the end-of-match position of prior m//g)
像要濾標題為
hi 或 Re: hi
就要使用 PCRE 的查詢方式
\nSubject: hi\r\n
\nSubject: Re: hi\r\n
這樣就能準確抓到. _________________ *若是想問問題的話, 請務必不要塗改任何 IP, 網域資料, 您若不願貼上IP或網域, 請改以電子郵件來詢問. 謝謝您的配合.*
*若是回報疑似軟體的運行或邏輯或資料處理有誤的問題, 小弟很樂意去了解您的情況, 但請務必以最新版來做回報, 如果以郵件詢問, 請參考 http://www.raidenmaild.com/tw/feedback.html 的說明, 最好標題加個 RaidenMAILD 字樣, 才不致會遺漏了您的信唷. 謝謝您的配合^^*
*在版上發文請遵守網路禮儀, 並請持著虛心敘述問題請教他人, 凡發現違反的文, 均一律刪除為優先, 不另行通知喔.
*與使用者教學相長腦力激盪是我輩成就感的來源, 誠心希望您能不吝指教.
*雷電MAILD 知識庫文件 http://www.raidenmaild.com/tw/kb/
素還尊
Team John Long.
Email: arnor@raidenmaild.com
公司網站 http://www.raidenmaild.com/company/ |
|
回頂端 |
|
|
Eric0626 八段
註冊時間: 2004-02-11 文章: 175 來自: TAIWAN
|
發表於: 星期三 五月 12, 2004 7:29 pm 文章標題: |
|
|
真是不好意思~程度太差 ,看不太懂 ,有人可以多舉一些範例嗎?
謝謝!!
例如 : ~無收件者 or 無寄件者 的廣告信怎過濾阿!! _________________ 雷電 :MAILD 4.6
雷電 :FTPD v2.4.3401
DNS:TWNIC 代管
系統 :Windows 2016 Server
防毒 :TrendMicro OfficeScan |
|
回頂端 |
|
|
serverq 一級
註冊時間: 2003-09-18 文章: 39 來自: TAIWAN
|
發表於: 星期五 五月 14, 2004 10:37 am 文章標題: |
|
|
素大:
以下這些是要設定的參數嗎??
\b Match a word boundary
\B Match a non-(word boundary)
\A Match only at beginning of string
\Z Match only at end of string, or before newline at the end
\z Match only at end of string
\G Match only at pos() (e.g. at the end-of-match position of prior m//g)
-------------------------------------------------------
1.是否使用 NAT 是 (D-LINK 704)
2.是否使用防火牆軟體 有 (PC-Cillin 2004)安全防護等級=高
3.是否使用防毒軟體 是 (PC-Cillin 2004)
4.使用網路 GIGA ADSL 2048/384 固IP
5.雷電MAIL 1.9.0.6 file XP update 4 (商業版)
6.作業系統 Windows2000 Professional Pack 4
7.系統配備 AMD Athlon 800MHz/SDRAM 1024MB/HD-WD 120GB |
|
回頂端 |
|
|
asec 五段
註冊時間: 2003-12-19 文章: 103 來自: 台灣 , 中華民國
|
發表於: 星期日 五月 23, 2004 3:16 pm 文章標題: |
|
|
最近…近五成的機率是廣告信
pcre 設定無效
不用 pcre 設定
一樣無效…
完全沒有過濾到
∵在標題設定上∵
[PCRE]\w 行銷
[PCRE]行銷
行銷
\nSubject: 行銷\r\n
以上全部失敗
是我設定錯了嗎?
=============
asec.idv.tw
maild
dnsd
ftpd |
|
回頂端 |
|
|
Arnor 究極の素還尊
註冊時間: 2001-11-07 文章: 13011 來自: TAIWAN
|
發表於: 星期二 六月 01, 2004 4:42 pm 文章標題: Re: [PCRE] PCRE 交流園地.. |
|
|
Arnor 寫到: |
像要濾標題為
hi 或 Re: hi
就要使用 PCRE 的查詢方式
\nSubject: hi\r\n
\nSubject: Re: hi\r\n
這樣就能準確抓到. |
上面少講一句話
就是這是要設在
"內文過濾器裡"
not 標題. _________________ *若是想問問題的話, 請務必不要塗改任何 IP, 網域資料, 您若不願貼上IP或網域, 請改以電子郵件來詢問. 謝謝您的配合.*
*若是回報疑似軟體的運行或邏輯或資料處理有誤的問題, 小弟很樂意去了解您的情況, 但請務必以最新版來做回報, 如果以郵件詢問, 請參考 http://www.raidenmaild.com/tw/feedback.html 的說明, 最好標題加個 RaidenMAILD 字樣, 才不致會遺漏了您的信唷. 謝謝您的配合^^*
*在版上發文請遵守網路禮儀, 並請持著虛心敘述問題請教他人, 凡發現違反的文, 均一律刪除為優先, 不另行通知喔.
*與使用者教學相長腦力激盪是我輩成就感的來源, 誠心希望您能不吝指教.
*雷電MAILD 知識庫文件 http://www.raidenmaild.com/tw/kb/
素還尊
Team John Long.
Email: arnor@raidenmaild.com
公司網站 http://www.raidenmaild.com/company/ |
|
回頂端 |
|
|
asec 五段
註冊時間: 2003-12-19 文章: 103 來自: 台灣 , 中華民國
|
發表於: 星期六 六月 12, 2004 12:47 am 文章標題: |
|
|
PCRE
經過以上數種方法…
仍無法過濾??? |
|
回頂端 |
|
|
Arnor 究極の素還尊
註冊時間: 2001-11-07 文章: 13011 來自: TAIWAN
|
發表於: 星期一 六月 14, 2004 9:14 am 文章標題: |
|
|
asec 寫到: | PCRE
經過以上數種方法…
仍無法過濾??? |
pcre_tester 可以測試呀
自己貼信件內容去當測試內容... _________________ *若是想問問題的話, 請務必不要塗改任何 IP, 網域資料, 您若不願貼上IP或網域, 請改以電子郵件來詢問. 謝謝您的配合.*
*若是回報疑似軟體的運行或邏輯或資料處理有誤的問題, 小弟很樂意去了解您的情況, 但請務必以最新版來做回報, 如果以郵件詢問, 請參考 http://www.raidenmaild.com/tw/feedback.html 的說明, 最好標題加個 RaidenMAILD 字樣, 才不致會遺漏了您的信唷. 謝謝您的配合^^*
*在版上發文請遵守網路禮儀, 並請持著虛心敘述問題請教他人, 凡發現違反的文, 均一律刪除為優先, 不另行通知喔.
*與使用者教學相長腦力激盪是我輩成就感的來源, 誠心希望您能不吝指教.
*雷電MAILD 知識庫文件 http://www.raidenmaild.com/tw/kb/
素還尊
Team John Long.
Email: arnor@raidenmaild.com
公司網站 http://www.raidenmaild.com/company/ |
|
回頂端 |
|
|
asec 五段
註冊時間: 2003-12-19 文章: 103 來自: 台灣 , 中華民國
|
發表於: 星期六 六月 19, 2004 9:22 pm 文章標題: |
|
|
試過…
最好用的…還是 .
直接在標題部份…
打入 .行銷 .貨款
只要是有行銷或貨款 標題的 廣告信…
都會被擋下來 |
|
回頂端 |
|
|
yuping 五段
註冊時間: 2003-05-06 文章: 101 來自: 中華民國
|
發表於: 星期二 六月 22, 2004 9:37 am 文章標題: |
|
|
請問像有些廣告信寄件者是xxxxx8z8z@ms36.hinet.net''
其中8是0~9、z是隨機的英文字母、@後面也是隨機
請問這種要怎樣設定PCRE??
thx |
|
回頂端 |
|
|
Arnor 究極の素還尊
註冊時間: 2001-11-07 文章: 13011 來自: TAIWAN
|
發表於: 星期三 六月 23, 2004 9:50 pm 文章標題: |
|
|
yuping 寫到: | 請問像有些廣告信寄件者是xxxxx8z8z@ms36.hinet.net''''
其中8是0~9、z是隨機的英文字母、@後面也是隨機
請問這種要怎樣設定PCRE??
thx |
若以這樣的case,
這是串亂產生的動態字串,
應該是無規則可言... _________________ *若是想問問題的話, 請務必不要塗改任何 IP, 網域資料, 您若不願貼上IP或網域, 請改以電子郵件來詢問. 謝謝您的配合.*
*若是回報疑似軟體的運行或邏輯或資料處理有誤的問題, 小弟很樂意去了解您的情況, 但請務必以最新版來做回報, 如果以郵件詢問, 請參考 http://www.raidenmaild.com/tw/feedback.html 的說明, 最好標題加個 RaidenMAILD 字樣, 才不致會遺漏了您的信唷. 謝謝您的配合^^*
*在版上發文請遵守網路禮儀, 並請持著虛心敘述問題請教他人, 凡發現違反的文, 均一律刪除為優先, 不另行通知喔.
*與使用者教學相長腦力激盪是我輩成就感的來源, 誠心希望您能不吝指教.
*雷電MAILD 知識庫文件 http://www.raidenmaild.com/tw/kb/
素還尊
Team John Long.
Email: arnor@raidenmaild.com
公司網站 http://www.raidenmaild.com/company/ |
|
回頂端 |
|
|
asec 五段
註冊時間: 2003-12-19 文章: 103 來自: 台灣 , 中華民國
|
發表於: 星期四 六月 24, 2004 10:26 pm 文章標題: |
|
|
最近比對了一下保留下來的廣告信…
有許多都是只有在本文區 一張大 圖片的連結
而沒有任何的文字…
像這種的… 就不清楚該如何 過濾了…
還有…
沒有主旨的 和 (No subject) 的…好像都是 (No subject) ....
這種的… 我也不知道 該如何檔…
不知道有沒有人擋過這兩種… 謝謝 |
|
回頂端 |
|
|
asec 五段
註冊時間: 2003-12-19 文章: 103 來自: 台灣 , 中華民國
|
發表於: 星期四 六月 24, 2004 10:33 pm 文章標題: |
|
|
Arnor 寫到: | yuping 寫到: | 請問像有些廣告信寄件者是xxxxx8z8z@ms36.hinet.net''''''''
其中8是0~9、z是隨機的英文字母、@後面也是隨機
請問這種要怎樣設定PCRE??
thx |
若以這樣的case,
這是串亂產生的動態字串,
應該是無規則可言... |
這一種的…
以前在用 outlook express 時…
都會加入過濾… 自己的 英文 ID (例如:英文 ID 是 asec) asec
這類的廣告信… 大多是
亂數 & (英文ID) & 亂數 @xxxx.xxxx.xxx
在 pcre 中…我就不清楚該如何下
目前我遇到的是… 我的英文 id 和 網域…有一樣的名稱…
網域內自己人寄來的就會… ^^|||| |
|
回頂端 |
|
|
ufay 真迅帝
註冊時間: 2002-12-07 文章: 443 來自: 中華民國
|
發表於: 星期三 六月 30, 2004 8:25 pm 文章標題: |
|
|
想請問素大
PCRE的設定是否只能針對英文及數字有用
如果是中文字則不行
因為我試過用相同參數設定去辨識信件的主旨
如果主只是英文字母或數字都可以成功的辨識
但如果主旨式中文字的話則PCRE都無法辨識到這封信 |
|
回頂端 |
|
|
Arnor 究極の素還尊
註冊時間: 2001-11-07 文章: 13011 來自: TAIWAN
|
發表於: 星期四 七月 01, 2004 12:13 am 文章標題: |
|
|
ufay 寫到: | 想請問素大
PCRE的設定是否只能針對英文及數字有用
如果是中文字則不行
因為我試過用相同參數設定去辨識信件的主旨
如果主只是英文字母或數字都可以成功的辨識
但如果主旨式中文字的話則PCRE都無法辨識到這封信 |
這是當然.
正規表示式哪會管中文.... _________________ *若是想問問題的話, 請務必不要塗改任何 IP, 網域資料, 您若不願貼上IP或網域, 請改以電子郵件來詢問. 謝謝您的配合.*
*若是回報疑似軟體的運行或邏輯或資料處理有誤的問題, 小弟很樂意去了解您的情況, 但請務必以最新版來做回報, 如果以郵件詢問, 請參考 http://www.raidenmaild.com/tw/feedback.html 的說明, 最好標題加個 RaidenMAILD 字樣, 才不致會遺漏了您的信唷. 謝謝您的配合^^*
*在版上發文請遵守網路禮儀, 並請持著虛心敘述問題請教他人, 凡發現違反的文, 均一律刪除為優先, 不另行通知喔.
*與使用者教學相長腦力激盪是我輩成就感的來源, 誠心希望您能不吝指教.
*雷電MAILD 知識庫文件 http://www.raidenmaild.com/tw/kb/
素還尊
Team John Long.
Email: arnor@raidenmaild.com
公司網站 http://www.raidenmaild.com/company/ |
|
回頂端 |
|
|
kiner 帝王
註冊時間: 2002-01-27 文章: 337 來自: 中華民國
|
發表於: 星期五 七月 30, 2004 1:43 pm 文章標題: |
|
|
今天跟 asec 大大請教
學到了一些 RE(regulation Expression) 的使用方法
以下幾個範例
希望能幫到被廣告信困擾的大大的忙
以後就不怕編碼的信了
如果想抓單一字串, 如: mailserver
則使用
.mailserver
如果想要抓連結 , 如 www.mailserver.com
則使用
.www.mailserver.com
如果想抓有-連起來的字串, 如 twav-vcd.com
則使用
.(twav)-(vcd).com
至於有特殊規則的...就請有需要的大大提出來
讓各高手討論一下吧.. |
|
回頂端 |
|
|
|
|
您 無法 在這個版面發表文章 您 無法 在這個版面回覆文章 您 無法 在這個版面編輯文章 您 無法 在這個版面刪除文章 您 無法 在這個版面進行投票
|
Powered by phpBB © 2001-2007 phpBB Group
|