Habilitando filtro Bayesiano com amavisd-new + Spamassassin

6

Eu executo um servidor de e-mail Postfix no CentOS e estou tentando ativar o filtro de bayes de Spamassassin, mas parece que estou perdendo alguma coisa.

Estamos executando o amavisd-new 2.9.1:

Name        : amavisd-new
Arch        : noarch
Version     : 2.9.1
Release     : 2.el6
Size        : 3.0 M
Repo        : installed
From repo   : epel

... com Spamassassin 3.3.1:

Installed Packages
Name        : spamassassin
Arch        : x86_64
Version     : 3.3.1
Release     : 3.el6
Size        : 3.1 M
Repo        : installed
From repo   : updates

Pelo que eu posso dizer, meus únicos arquivos de configuração do spamassassin estão localizados em / etc / mail / spamassassin.

O arquivo local.cf nesse diretório contém o seguinte:

# These values can be overridden by editing ~/.spamassassin/user_prefs.cf
# (see spamassassin(1) for details)

# These should be safe assumptions and allow for simple visual sifting
# without risking lost emails.

required_hits 5
report_safe 0
rewrite_header Subject [SPAM]
use_bayes 1
bayes_auto_learn 1
bayes_auto_expire 0
bayes_path /var/amavis/var/.spamassassin/

O amavisd.conf está localizado em / etc / amavisd /, e eu acho que incluí todas as configurações que preciso para ativar o "spamassassin", mas não sou positivo .

Alguns sites que li indicam que o filtro bayesiano precisa ser treinado em 100 mensagens (para mensagens de spam e não spam) usando sa-learn , mas já vi pelo menos um website indicando que o filtro precisa ser treinado em 200 mensagens. Dito isso, posso confirmar que treinei o filtro em pelo menos 100 mensagens de spam.

Agora, sempre que recebo um e-mail, depois de treinar o filtro nessas 100 mensagens de spam, ainda não vejo indicações nos cabeçalhos de e-mail usados pelo filtro baysiano:

X-Virus-Scanned: amavisd-new at developcents.com
X-Spam-Flag: NO
X-Spam-Score: -0.525
X-Spam-Level:
X-Spam-Status: No, score=-0.525 tagged_above=-999 required=4
    tests=[HK_RANDOM_FROM=1, HTML_MESSAGE=0.001, RP_MATCHES_RCVD=-2.499,
    SPF_SOFTFAIL=0.972, URIBL_BLOCKED=0.001] autolearn=unavailable

Mesmo que os bayes ainda não estejam totalmente treinados e prontos para serem "usados", não deveria estar vendo uma tag na seção X-Spam-Status que indica se ela está ou não usando o filtro Bayes?

(Para que vale a pena, o e-mail para o qual eu postei o cabeçalho de e-mail parcial acima, era spam e obviamente não foi marcado como tal)

Há algo que me falta?

    
por David W 11.09.2014 / 22:00

1 resposta

3

Eu atualizei recentemente o servidor de e-mail para um novo servidor do CentOS 7 (do CentOS 6) que não faz nada além de e-mail e DNS. O servidor anterior do CentOS 6 também estava executando vários sites no Apache.

Não sei ao certo o que estou fazendo de maneira diferente, o que está causando a apresentação de bayes nos cabeçalhos de e-mail como um teste que foi executado, mas parece que tenho o Bayes totalmente configurado. Aqui está como eu estou fazendo isso:

Como antes, estou executando o Postfix com amavisd-new sendo usado como o principal scanner de vírus e spam. amavisd-new então passa para o spamassassin.

O postfix é a versão 2.10.1 do repositório CentOS Plus, o amavisd-new é a versão 2.10.1 do repositório EPEL e o spamassassin é a versão 3.4.0 do repositório base.

O arquivo de configuração do spamassassin é o seguinte:

[root@mail ~]# cat /etc/mail/spamassassin/local.cf 

    required_hits       5
    report_safe         0
    rewrite_header Subject [SPAM]
    razor_config /etc/mail/spamassassin/.razor/razor-agent.conf
    use_bayes       1
    bayes_path /var/spamassassin/bayes
    bayes_file_mode     077
    auto_learn      0
    use_razor2      1

E agora, meus cabeçalhos de e-mail indicam que o teste de bayes está sendo executado:

X-Virus-Scanned: amavisd-new at developcents.com
X-Spam-Flag: NO
X-Spam-Score: 5.129
X-Spam-Level: *****
X-Spam-Status: No, score=5.129 tagged_above=-999 required=6.2
    tests=[BAYES_99=3.5, BAYES_999=0.2, DKIM_SIGNED=0.1, DKIM_VALID=-0.1,
    DKIM_VALID_AU=-0.1, HTML_FONT_LOW_CONTRAST=0.001, HTML_MESSAGE=0.001,
    MIME_HTML_ONLY=0.723, MIME_QP_LONG_LINE=0.001, RDNS_NONE=0.793,
    SPF_PASS=-0.001, T_REMOTE_IMAGE=0.01, URIBL_BLOCKED=0.001]
    autolearn=no autolearn_force=no

Infelizmente, ainda estou tentando lidar com o spam, pois a maioria das mensagens ainda está chegando ao radar (com uma pontuação de 6,1 ou menos), mas estou progredindo bastante.

Por que vale a pena, isso é um pouco fora do tópico, mas eu recomendo as seguintes RBLs no Postfix main.cf como parte da definição smtpd_recipient_restrictions (note que você precisa se registrar antes de usar um par de essas listas):

reject_rbl_client zen.spamhaus.org,
reject_rbl_client bl.spamcop.net,
reject_rbl_client b.barracudacentral.org,
reject_rbl_client dnsbl.sorbs.net,
reject_rbl_client cbl.abuseat.org,
reject_rbl_client dnsbl-1.uceprotect.net,
reject_rbl_client dnsbl-3.uceprotect.net,

Espero que isso ajude alguém.

    
por 30.06.2015 / 13:50