problema do bogofilter. Como faço para redefinir o "aprendizado do bogofilter"

0

Meu bogofilter coloca bons e-mails em spam. Eu gostaria de saber como redefinir todo o "aprendizado" para que eu possa treiná-lo novamente. Desinstalar o bogofilter parece desinstalar o programa, mas não os "dados aprendidos". Como extrair os "dados aprendidos". Eu quero então começar com ardósia limpa. -thanks

my system:
ubuntu 14.04
evolution 3.10.4 ( which I understand includes the bogofilter)
classic gnome
    
por user2712329 19.10.2014 / 17:19

2 respostas

1

Eu encontrei isso no site deles (parece-me que você pode criar um lista de palavras em um arquivo de texto e, em seguida, pode editar este arquivo e usar este novo arquivo filtrado novamente):

% bl0ck_qu0te%

Bogoutil permite que você copie uma lista de palavras e carregue os tokens em uma nova lista de palavras. Com o uso adicional de awk e grep, as contagens podem ser zeradas e os tokens com contagens zero para spam e não-spam podem ser excluídos. Os comandos a seguir excluirão os tokens das mensagens de spam:

bogoutil -d wordlist.db | \
awk '{print $1 " " $2 " 0"}' | grep -v " 0 0" | \
bogoutil -l wordlist.new.db

Os comandos a seguir excluirão os tokens de mensagens que não são spam:

bogoutil -d wordlist.db | \
awk '{print $1 " 0 " $3}' | grep -v " 0 0" | \
bogoutil -l wordlist.new.db

Em relação a

% bl0ck_qu0te%

Você provavelmente precisará "limpar" o aplicativo. Em geral, os arquivos criados pelo usuário e as configurações não são removidos ao excluir o software. Veja Qual é a maneira correta de remover completamente um aplicativo? para informações sobre isso.

    
por Rinzwind 19.10.2014 / 17:29
0

Alegria parcial. Eu fiz o que você sugeriu. O presunto que é classificado como spam é, na verdade, o meu e-mail do empregador, então você pode imaginar que é um problema premente. Depois de fazer o que você disse, no primeiro dia ele categorizou 3 emails, mas não todos do meu empregador. Na última semana, ele categorizou mal um terço dos e-mails do meu empregador como spam. Então eu todos esses e-mails como presunto. Mas ainda cometendo erros. Talvez eu dê mais uma semana.

Estamos realmente certos de que a informação "aprendida" é apenas a palavra db no .bogofilter. Há talvez alguma outra informação que aprendeu - agarrando os canudos. -thanks

    
por user2712329 28.10.2014 / 05:01