常被大量的垃圾郵件困擾著,每天打開信箱,總會收到數十,甚至數百封的垃圾信件,每次看到這一整排的「低利貸款…」「工具光碟補帖大拍賣…」真想拿機關槍掃射這些亂發垃圾信的 人吶~~

這陣子使用了一個小軟體POPFile,使用的時候並沒有抱著太大的期望,不過用了一星期後,發現它真的很好用,我目前打開郵件信箱時,至少迎接我的不會再是那一整排的貸款或是情色的主旨了。


這個軟體不能說它是「擋」郵件的軟體,正確的說法應該是「幫郵件作分類」的軟體,幫郵件作分類這件事如何處理掉垃圾郵件呢?這就是需要相關技巧配合啦!

先介紹一下POPFile,這是一種智慧型分類辨識郵件的軟體,一開始必須先由使用者來「訓練」軟體,先手動分類幾次正常郵件與垃圾郵件,軟體會記憶分類郵件的特性,所以一旦新郵件出現,軟體會去分析信件裡的寄件者、相關字詞或是某些特性,判斷它較符合使用者先前所分類過的正常或是垃圾郵件,然後將每封郵件分類到預設的四種信箱「spam」、「personal」、「work」、「other」,所以一旦收到分類好的信件後,在主旨前方會出現〔spam〕或是〔work〕…以此類推。



軟體安裝時,它會自動抓取電腦內的郵件設定,然後讓使用者勾選要使用POPFile的郵件帳號。



軟體安裝好後,會在螢幕右下方的工作列上出現一隻黃色的章魚,基本上不去shut down這個軟體的話,它會常駐在系統上,不需要特別去執行它。
要「訓練」它的時候,只要點擊兩下執行它,就會出現以下的畫面:


POPFile Control Center ,選擇「History」,會出現 透過軟體抓取的郵件主旨,使用的語系是UTF-8,所以進入時中文信件常出現亂碼。

這部分我也有這個亂碼的問題始終沒辦法解決,已經照著說明到語言設定的欄位去填上了Chinese Traditional – BIG5,但是仍然沒有用,每進入一次,就要手動去設定一下繁體中文的語系,不曉得原因是什麼,這部分還挺麻煩的。


紅線框起來的地方就是我們要「訓練」POPFile 的動作了,在Bucket的部分,是軟體幫你判斷信件的分類,右邊的下拉式選單則是讓使用者來修正分類,修正過後會自動記憶,下一次有類似的關鍵字與內容,它會自動分類到上次修正的類別。

接下來再打開郵件的收信軟體,信件開始收取時,會自動在主旨前方加上分類的標誌。

好了,自動判斷分類好了後呢?


接下來就是「郵件規則」這個功能要出馬了,既然垃圾信的主旨已經分類為〔spam〕xxxxx,所以只要加入一個規則,內容自訂,大略就是主旨若有〔spam〕的文字,郵件就自動刪除、移動到某個資料夾、移動到刪除的郵件…等等,自行判斷啦~


我的範例是先幫我自動移動到「SPAM」的資料夾,有空時再大致看一下有沒有不小心分類錯誤的信件,若沒有,就可以整批信件刪除了。

若是有漏網之魚沒被冠上〔spam〕的信件,或是分類錯誤的信件,只要再進POPFile Control Center 修正一下即可。


我大約使用了一星期,修正了3~4次左右,目前即可達到95.14%的正確率了。

這種使用的分類技術叫做「Naive Bayes」,中文又稱為貝式分類法,可以看這裡的參考資料


對於某些信箱總是會每日天外飛來大量垃圾郵件,這個軟體倒是幫了我不少忙,我認為挺值得推薦給與我有相同困擾的朋友來使用!


POPFile 官方網站
POPFile 下載位址
中文解說頁面


創作者介紹
創作者 cat108 的頭像
cat108

貓在家裡

cat108 發表在 痞客邦 留言(0) 人氣()