LifeType 中文開發論壇

支援 => 使用與操作 => 主題作者是: astaka 於 一月 28, 2005, 08:56:45 上午



主題: 請問一堆spam comments怎麼快速刪除?
作者: astaka一月 28, 2005, 08:56:45 上午
今天早上一看,哇,來了三百多個spam comments =__=!
我想去刪除,卻發現管理頁面裡,它沒有像MT裡的recent comments列表.
那.......這要怎麼刪丫..???
一個一個去找出來刪會昏倒也...
HELP~


主題: 傷腦筋!
作者: markwu一月 28, 2005, 10:12:30 上午
前台目前是有 recent comments ,但是後台沒有。目前要大量刪除 comments 得方式只有 從資料庫下 sql 去砍。

1.0 我預計會再加上兩個外掛程式:
=> 大量修改類別 (Post, Link, Resource)
=> 大量刪除 (Post, Link, Resource)

但是要等我把手邊的 plugins 全部 porting 跟檢查完才會進行。

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: astaka一月 28, 2005, 10:23:24 上午
Thanks Mark,I try to remove them by hand first..... :'(
And wait for version 1.0 ~


主題: 請問一堆spam comments怎麼快速刪除?
作者: bcse一月 28, 2005, 01:48:32 下午
我覺得一篇一篇刪除很有成就感,但是不要直接刪除,而是標示為垃圾迴響,然後你的貝氏過濾就會變聰明,下次只要去按一下清理垃圾迴響,那些 Spam 就會自動消失了。


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu一月 29, 2005, 12:18:18 上午
引用自: bcse
一篇一篇刪除很有成就感


哇!這...這...太變態了吧!他有 300 多篇耶!嘻嘻! :-P

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: bcse一月 29, 2005, 09:38:30 上午
引用自: markwu
引用自: bcse
一篇一篇刪除很有成就感

哇!這...這...太變態了吧!他有 300 多篇耶!嘻嘻! :-P
Mark


我有 200 多篇,一篇一篇刪的,一次多開幾個視窗其實還滿快的  :-P


主題: 請問一堆spam comments怎麼快速刪除?
作者: Loaf二月 18, 2005, 04:46:26 上午
哈!我同意Mark,我們刪個一百篇就打壞了一天的好心情,
您真是太強健了。


主題: 請問一堆spam comments怎麼快速刪除?
作者: lss二月 18, 2005, 12:21:45 下午
hi mark & all:
我有幾個構想
1.應該可以在plog的安裝包裡加入預設的貝氏過濾規則吧 :-)
請bcse或其它被spam回響光顧過的人貢獻過濾規則。因為這些spam的特點應該差不多吧!不過我不熟悉貝氏過濾的運作方式,怎麼做還要研究。
2.我自己的plog只有在第一次出現spam回響時,將它標為spam,後來的spam回響便被自動判斷了。假設一下子出現了很多spam,因為這些spam的特徵相似,我希望只要標示個幾篇成為spam,然後有一個功能能夠重新整理回響,讓新的貝氏過濾規則能套用在的回響上,那就不用刪得那麼辛苦了。
3.也許再做個匯入貝氏過濾規則的功能也不錯。

我來試試看吧!不過,清處貝氏過濾運作的人來做會比我快。 :-D


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu二月 18, 2005, 01:27:55 下午
Hi lss:

呵呵!那得要有一堆 的 SPAM 來辨識才行!另外 Basian Filter 對於中文是沒有用的,因為他是以英文斷字為原則。

我其實會建議佣 content filter,把

/poker/i
/sex/i
....

等等加進去。會比較簡單。你認為呢?

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: bcse二月 18, 2005, 08:37:12 下午
我想 Bayesian Filter 對中文還是有一點用,他也幫我擋下了不少簡體中文的 spam ,只不過最近也把一位訪客的迴響當成 spam 擋了下來... 對於 poker 就真的幫助很大了。

content filter 看起來的確滿不錯的,我也喜歡這個,只不過會怕字串設得不好,說不定會誤砍...  :-P

現在有許多 spammer 都是將網址放在迴響者URL那裡,所以或許可以鎖 Domain Name。

最近還看到一個好像很神奇的擋 spammer 方法, DNSBL (http://weblog.sinteur.com/index.php?p=8106) ,或許也能作為參考。

雖然說刪 spam 很有成就感 XD 不過還是覺得很無奈...
(但是看到我的 Bayesian Filter 愈來愈聰明,我就覺得辛苦是值得的 XD)


主題: 請問一堆spam comments怎麼快速刪除?
作者: lss二月 18, 2005, 09:08:50 下午
引用自: markwu

呵呵!那得要有一堆 的 SPAM 來辨識才行!

剛剛看了一下plog的db table,我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D
引用自: markwu

另外 Basian Filter 對於中文是沒有用的,因為他是以英文斷字為原則。

這個我就不清楚了 :p
引用自: markwu

我其實會建議佣 content filter,把

/poker/i
/sex/i
....

等等加進去。會比較簡單。你認為呢?

Mark

可是, content filter不是只要符合其中一條規則就拒絕回響嗎?比起來,bayesian filter 就比較有彈性點。


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu二月 18, 2005, 10:20:02 下午
引用自: bcse
我想 Bayesian Filter 對中文還是有一點用,他也幫我擋下了不少簡體中文的 spam ,只不過最近也把一位訪客的迴響當成 spam 擋了下來... 對於 poker 就真的幫助很大了


ㄟ!這是因為這些 spammer 在內文中留下URL.... 而 URL 因為可以用 "." 來斷字,所以可以學習。

這是我在做 popfile 中文化時學到的!當初還要幫他作 中文->轉拼音,這樣才能正確判斷斷字。但對 perl 實在不懂 :( 所以就沒繼續了。

引用自: bcse

最近還看到一個好像很神奇的擋 spammer 方法, DNSBL (http://weblog.sinteur.com/index.php?p=8106) ,或許也能作為參考。


這方法不錯,應該可以加到plog 裡面。

另外 content filter 在 1.0 以經會去 scan topic/text/name/url/e-mail .... 只要任一個內容符合,就檔!

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu二月 18, 2005, 10:26:36 下午
引用自: lss
我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D


只是這樣在安裝時得多一選選項,要不要安裝預設,Baysian Token ... 這可以跟 Oscar 討論看看。

引用自: lss
可是, content filter不是只要符合其中一條規則就拒絕回響嗎?比起來,bayesian filter 就比較瞭解!有彈性點。


呵呵!沒錯!但是到堵就要堵的狠一點。嘻嘻!

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: bcse二月 19, 2005, 01:30:30 下午
引用自: lss
引用自: markwu

呵呵!那得要有一堆 的 SPAM 來辨識才行!

剛剛看了一下plog的db table,我的意思是,將plog_bayesian_tokens裡的資料匯出sql語法,然後,在安裝程序裡,將這些資料(選擇)直接加入資料庫。至於資料來源,bcse不是以他的 bayesian filter 為榮嗎?! :D


沒有引以為榮啦 XP

如果要預設 bayesian token 的話我覺得資料來源愈多愈好,我這邊好像只遇過 poker 和一些大陸的 spammer (大陸的那些現在被我擋到都不來了 XD)


主題: 請問一堆spam comments怎麼快速刪除?
作者: oc二月 20, 2005, 12:43:23 下午
其實上面第四則bcse的回應,應該就是目前最有效的做法了吧。只不過他大概回應太快,第一句就說「一篇一篇刪很有成就感」,讓大家沒有注意到他後面緊接著的最有效的建議:

不要直接刪除,而是標示為垃圾迴響,然後你的貝氏過濾就會變聰明,下次只要去按一下清理垃圾迴響,那些 Spam 就會自動消失了。#

我自己也是到春節當天被垃圾迴響攻擊,搞了好久才終於明白原來照著bcse的做法做,刪起來並不難。

當然,如果像astaka那樣,一早起來當場看到三百多封spam迴響,那確實是很辛苦(每一封都要先標記為spam,但先不要刪除),只好當是對貝氏過濾器的「魔鬼訓練課程」吧。

一、先確認你的貝氏過濾器是啟動的

請到「管理介面→全站管理系統→全域設定→貝氏過濾(Bayesian Filter)設定」裡面,把「bayesian_filter_enabled」設為「是」,按更新。

二、開始訓練你的貝氏過濾器

找到該文的迴響,在你想標示為垃圾迴響的那一則「狀態」欄,按一下「Mark As Spam」,有多少垃圾迴響就標多少次,這就是對貝氏過濾器的「訓練」啦(因此你應該感謝spammer為你貢獻了實戰的訓練教材啊 :-P )。

三、一個按鈕解決所有垃圾

請到「管理介面→全站管理系統→站台統計→清理垃圾」裡面,按一下「清理垃圾迴響」就行了。

經過這一番訓練,你的貝氏過濾器會越變越聰明,以後你幾乎只要執行第三步就可以解決那些垃圾迴響了。


主題: 請問一堆spam comments怎麼快速刪除?
作者: bcse二月 20, 2005, 05:29:39 下午
我今天遇到了 TrackBack Spam ... 於是讓我想到這個也需要解決呢!! 目前的 Content Filter 有辦法阻擋這種 Spam 嗎?


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu二月 21, 2005, 12:38:09 上午
1.1 預計會把目前用來檔 comment spam bots 的武器全用到 trackback 跟 referers 上。除非有人幫忙寫,否則只能等到那時候了。

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: brian七月 12, 2005, 02:31:33 下午
請教一下各位是如何設定貝氏過慮的數值?我用預設的設定,結果越變越笨,現在只要是回響裡面有出現網址的全部都被當成垃圾了.


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu七月 13, 2005, 11:35:05 上午
引用自: brian
請教一下各位是如何設定貝氏過慮的數值?我用預設的設定,結果越變越笨,現在只要是回響裡面有出現網址的全部都被當成垃圾了.


To Drian:

貝氏迴響其實用來檔 英文垃圾迴響很棒的,但是擋中文就不行了,因為是用『斷字』來判斷每一個『字詞』在垃圾迴響中的機率,再來判斷這一偏迴響是不是垃圾迴響。

中文的斷字,應英文斷字法是斷不出來的 :(

所以我目前測英文的結果真的不錯 95% 都檔的下來。但是對於中文結果就很差!

你是用來檔中文還是英文的呢?

BTW,我目前是完全按照預設的設定沒去動他。

Mark


主題: 請問一堆spam comments怎麼快速刪除?
作者: brian七月 13, 2005, 12:52:43 下午
我看DB裡面的tokens,大概有五萬個,都是英文的.現在的問題不是擋不住,而是擋過頭,只要留言裡面有網址的都被擋掉了,只好把全部的tokens清光光...


主題: 請問一堆spam comments怎麼快速刪除?
作者: markwu七月 13, 2005, 01:18:17 下午
引用自: brian
我看DB裡面的tokens,大概有五萬個,都是英文的.現在的問題不是擋不住,而是擋過頭,只要留言裡面有網址的都被擋掉了,只好把全部的tokens清光光...


我知道,因為該訓練的都訓練過了.... 每個英文字都當成了 spam ... 這就麻煩了。因為都是『反例』訓練,沒有『正例』訓練。

Mark