主題: 請問一堆spam comments怎麼快速刪除? 作者: astaka 於 一月 28, 2005, 08:56:45 上午 今天早上一看,哇,來了三百多個spam comments =__=!
我想去刪除,卻發現管理頁面裡,它沒有像MT裡的recent comments列表. 那.......這要怎麼刪丫..??? 一個一個去找出來刪會昏倒也... HELP~ 主題: 傷腦筋! 作者: markwu 於 一月 28, 2005, 10:12:30 上午 前台目前是有 recent comments ,但是後台沒有。目前要大量刪除 comments 得方式只有 從資料庫下 sql 去砍。
1.0 我預計會再加上兩個外掛程式: => 大量修改類別 (Post, Link, Resource) => 大量刪除 (Post, Link, Resource) 但是要等我把手邊的 plugins 全部 porting 跟檢查完才會進行。 Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: astaka 於 一月 28, 2005, 10:23:24 上午 Thanks Mark,I try to remove them by hand first..... :'(
And wait for version 1.0 ~ 主題: 請問一堆spam comments怎麼快速刪除? 作者: bcse 於 一月 28, 2005, 01:48:32 下午 我覺得一篇一篇刪除很有成就感,但是不要直接刪除,而是標示為垃圾迴響,然後你的貝氏過濾就會變聰明,下次只要去按一下清理垃圾迴響,那些 Spam 就會自動消失了。
主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 一月 29, 2005, 12:18:18 上午 引用自: bcse 一篇一篇刪除很有成就感 哇!這...這...太變態了吧!他有 300 多篇耶!嘻嘻! :-P Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: bcse 於 一月 29, 2005, 09:38:30 上午 引用自: markwu 引用自: bcse 一篇一篇刪除很有成就感 哇!這...這...太變態了吧!他有 300 多篇耶!嘻嘻! :-P Mark 我有 200 多篇,一篇一篇刪的,一次多開幾個視窗其實還滿快的 :-P 主題: 請問一堆spam comments怎麼快速刪除? 作者: Loaf 於 二月 18, 2005, 04:46:26 上午 哈!我同意Mark,我們刪個一百篇就打壞了一天的好心情,
您真是太強健了。 主題: 請問一堆spam comments怎麼快速刪除? 作者: lss 於 二月 18, 2005, 12:21:45 下午 hi mark & all:
我有幾個構想 1.應該可以在plog的安裝包裡加入預設的貝氏過濾規則吧 :-) 請bcse或其它被spam回響光顧過的人貢獻過濾規則。因為這些spam的特點應該差不多吧!不過我不熟悉貝氏過濾的運作方式,怎麼做還要研究。 2.我自己的plog只有在第一次出現spam回響時,將它標為spam,後來的spam回響便被自動判斷了。假設一下子出現了很多spam,因為這些spam的特徵相似,我希望只要標示個幾篇成為spam,然後有一個功能能夠重新整理回響,讓新的貝氏過濾規則能套用在的回響上,那就不用刪得那麼辛苦了。 3.也許再做個匯入貝氏過濾規則的功能也不錯。 我來試試看吧!不過,清處貝氏過濾運作的人來做會比我快。 :-D 主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 二月 18, 2005, 01:27:55 下午 Hi lss:
呵呵!那得要有一堆 的 SPAM 來辨識才行!另外 Basian Filter 對於中文是沒有用的,因為他是以英文斷字為原則。 我其實會建議佣 content filter,把 /poker/i /sex/i .... 等等加進去。會比較簡單。你認為呢? Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: bcse 於 二月 18, 2005, 08:37:12 下午 我想 Bayesian Filter 對中文還是有一點用,他也幫我擋下了不少簡體中文的 spam ,只不過最近也把一位訪客的迴響當成 spam 擋了下來... 對於 poker 就真的幫助很大了。
content filter 看起來的確滿不錯的,我也喜歡這個,只不過會怕字串設得不好,說不定會誤砍... :-P 現在有許多 spammer 都是將網址放在迴響者URL那裡,所以或許可以鎖 Domain Name。 最近還看到一個好像很神奇的擋 spammer 方法, DNSBL (http://weblog.sinteur.com/index.php?p=8106) ,或許也能作為參考。 雖然說刪 spam 很有成就感 XD 不過還是覺得很無奈... (但是看到我的 Bayesian Filter 愈來愈聰明,我就覺得辛苦是值得的 XD) 主題: 請問一堆spam comments怎麼快速刪除? 作者: lss 於 二月 18, 2005, 09:08:50 下午 引用自: markwu 呵呵!那得要有一堆 的 SPAM 來辨識才行! 剛剛看了一下plog的db table,我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D 引用自: markwu 另外 Basian Filter 對於中文是沒有用的,因為他是以英文斷字為原則。 這個我就不清楚了 :p 引用自: markwu 我其實會建議佣 content filter,把 /poker/i /sex/i .... 等等加進去。會比較簡單。你認為呢? Mark 可是, content filter不是只要符合其中一條規則就拒絕回響嗎?比起來,bayesian filter 就比較有彈性點。 主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 二月 18, 2005, 10:20:02 下午 引用自: bcse 我想 Bayesian Filter 對中文還是有一點用,他也幫我擋下了不少簡體中文的 spam ,只不過最近也把一位訪客的迴響當成 spam 擋了下來... 對於 poker 就真的幫助很大了 。 ㄟ!這是因為這些 spammer 在內文中留下URL.... 而 URL 因為可以用 "." 來斷字,所以可以學習。 這是我在做 popfile 中文化時學到的!當初還要幫他作 中文->轉拼音,這樣才能正確判斷斷字。但對 perl 實在不懂 :( 所以就沒繼續了。 引用自: bcse 最近還看到一個好像很神奇的擋 spammer 方法, DNSBL (http://weblog.sinteur.com/index.php?p=8106) ,或許也能作為參考。 這方法不錯,應該可以加到plog 裡面。 另外 content filter 在 1.0 以經會去 scan topic/text/name/url/e-mail .... 只要任一個內容符合,就檔! Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 二月 18, 2005, 10:26:36 下午 引用自: lss 我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D 只是這樣在安裝時得多一選選項,要不要安裝預設,Baysian Token ... 這可以跟 Oscar 討論看看。 引用自: lss 可是, content filter不是只要符合其中一條規則就拒絕回響嗎?比起來,bayesian filter 就比較瞭解!有彈性點。 呵呵!沒錯!但是到堵就要堵的狠一點。嘻嘻! Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: bcse 於 二月 19, 2005, 01:30:30 下午 引用自: lss 引用自: markwu 呵呵!那得要有一堆 的 SPAM 來辨識才行! 剛剛看了一下plog的db table,我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D 沒有引以為榮啦 XP 如果要預設 bayesian token 的話我覺得資料來源愈多愈好,我這邊好像只遇過 poker 和一些大陸的 spammer (大陸的那些現在被我擋到都不來了 XD) 主題: 請問一堆spam comments怎麼快速刪除? 作者: oc 於 二月 20, 2005, 12:43:23 下午 其實上面第四則bcse的回應,應該就是目前最有效的做法了吧。只不過他大概回應太快,第一句就說「一篇一篇刪很有成就感」,讓大家沒有注意到他後面緊接著的最有效的建議:
不要直接刪除,而是標示為垃圾迴響,然後你的貝氏過濾就會變聰明,下次只要去按一下清理垃圾迴響,那些 Spam 就會自動消失了。# 我自己也是到春節當天被垃圾迴響攻擊,搞了好久才終於明白原來照著bcse的做法做,刪起來並不難。 當然,如果像astaka那樣,一早起來當場看到三百多封spam迴響,那確實是很辛苦(每一封都要先標記為spam,但先不要刪除),只好當是對貝氏過濾器的「魔鬼訓練課程」吧。 一、先確認你的貝氏過濾器是啟動的 請到「管理介面→全站管理系統→全域設定→貝氏過濾(Bayesian Filter)設定」裡面,把「bayesian_filter_enabled」設為「是」,按更新。 二、開始訓練你的貝氏過濾器 找到該文的迴響,在你想標示為垃圾迴響的那一則「狀態」欄,按一下「Mark As Spam」,有多少垃圾迴響就標多少次,這就是對貝氏過濾器的「訓練」啦(因此你應該感謝spammer為你貢獻了實戰的訓練教材啊 :-P )。 三、一個按鈕解決所有垃圾 請到「管理介面→全站管理系統→站台統計→清理垃圾」裡面,按一下「清理垃圾迴響」就行了。 經過這一番訓練,你的貝氏過濾器會越變越聰明,以後你幾乎只要執行第三步就可以解決那些垃圾迴響了。 主題: 請問一堆spam comments怎麼快速刪除? 作者: bcse 於 二月 20, 2005, 05:29:39 下午 我今天遇到了 TrackBack Spam ... 於是讓我想到這個也需要解決呢!! 目前的 Content Filter 有辦法阻擋這種 Spam 嗎?
主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 二月 21, 2005, 12:38:09 上午 1.1 預計會把目前用來檔 comment spam bots 的武器全用到 trackback 跟 referers 上。除非有人幫忙寫,否則只能等到那時候了。
Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: brian 於 七月 12, 2005, 02:31:33 下午 請教一下各位是如何設定貝氏過慮的數值?我用預設的設定,結果越變越笨,現在只要是回響裡面有出現網址的全部都被當成垃圾了.
主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 七月 13, 2005, 11:35:05 上午 引用自: brian 請教一下各位是如何設定貝氏過慮的數值?我用預設的設定,結果越變越笨,現在只要是回響裡面有出現網址的全部都被當成垃圾了. To Drian: 貝氏迴響其實用來檔 英文垃圾迴響很棒的,但是擋中文就不行了,因為是用『斷字』來判斷每一個『字詞』在垃圾迴響中的機率,再來判斷這一偏迴響是不是垃圾迴響。 中文的斷字,應英文斷字法是斷不出來的 :( 所以我目前測英文的結果真的不錯 95% 都檔的下來。但是對於中文結果就很差! 你是用來檔中文還是英文的呢? BTW,我目前是完全按照預設的設定沒去動他。 Mark 主題: 請問一堆spam comments怎麼快速刪除? 作者: brian 於 七月 13, 2005, 12:52:43 下午 我看DB裡面的tokens,大概有五萬個,都是英文的.現在的問題不是擋不住,而是擋過頭,只要留言裡面有網址的都被擋掉了,只好把全部的tokens清光光...
主題: 請問一堆spam comments怎麼快速刪除? 作者: markwu 於 七月 13, 2005, 01:18:17 下午 引用自: brian 我看DB裡面的tokens,大概有五萬個,都是英文的.現在的問題不是擋不住,而是擋過頭,只要留言裡面有網址的都被擋掉了,只好把全部的tokens清光光... 我知道,因為該訓練的都訓練過了.... 每個英文字都當成了 spam ... 這就麻煩了。因為都是『反例』訓練,沒有『正例』訓練。 Mark |