Eu sou um lutador anti-spam (pouco) vívido por mim mesmo. E por causa de muitos problemas que você encontrou, acabei fazendo as coisas sujas eu mesmo, anos atrás.
Agora, isso não é uma resposta para sua pergunta específica, mas para seu problema específico. Então, por favor, não faça downvote por causa disso.
Como resolvi esse problema, modifiquei o script sa_filter-post.pl, usado pelo servidor XMail, que chama spamc no arquivo de e-mail e faz algumas coisas menores lá, para processar não o arquivo inteiro, mas partes específicas dele , com base em algumas regras específicas (codificadas por mim). sim, regex'es mas até agora eles trabalham para mim (eu tenho um monte de outros scripts antes e depois deste para que possam desempenhar um papel)
Por exemplo, tenho um regex que sinaliza os números de telefone. O spammer deixou isso na íntegra, de modo que vai direto para o processo apenas o meio 400 caracteres do arquivo (cheguei a 400 por tentativa e erro realmente, começou a partir de 200). Note que é muito difícil escolher o meio do que você vê, comparado ao que está no arquivo.
Há outro que tem a mesma estrutura da tabela html com os "produtos", um cabeçalho fictício e um rodapé não utilizável, então eu removo esses itens, removo a coluna "products" e depois repassa isso para spamc.
E assim por diante, você entende a foto.
Mas nem todas as regras são perfeitas, por isso faço um pouco de magia atribuindo uma pontuação particular a cada regra, que codifico e sintonizo quando necessário, com base na forma como a regra se comporta (e por vezes acabo por eliminar governa todos juntos). Em seguida, modifico a pontuação SA pela pontuação particular. A razão pela qual eu fiz isso foi porque, por algum motivo, o SA apenas deu pontuações como 4. algo para colocar claramente spam em regras que eu também tinha strongs sentimentos para pegá-las corretamente. Então eu dei a eles um pequeno impulso para ultrapassar 5.0, juntamente com alguns scripts de pós-processamento que levam algumas outras variáveis em consideração (fonte de e-mail, alvo de e-mail, estrutura de cabeçalho, etc), mais ou menos mata o spam fora.
Agora percebo que isso não é o que você esperava, mas no meu caso isso me dá muito poder sobre o que é escaneado, é só que preciso configurar as coisas manualmente e, de vez em quando, fazer pequenos retoques nos valores / regex'es.
Mas, no seu caso, as coisas são muito mais fáceis, já que tudo o que você precisa fazer é usar um script bash simples que será chamado pelo seu MX em vez de spamc e ter esse script usando o comando head para obter o primeiro número de bytes. você quer e passa esse arquivo temporário para spamc.
O conteúdo do script vai depender um pouco do seu servidor de e-mail, mas isso não deve ser difícil de descobrir.
(Note que eu só falei muito da minha configuração para que você possa ver as possibilidades desta opção)
PS: Eu pessoalmente nunca recebi este tipo de e-mails de spam (com guloseimas relacionadas a programação neles), então eu me pergunto se você não irritou alguém e agora você está alvejado. Isso explicaria os e-mails especialmente criados. A razão pela qual eu penso sobre essa possibilidade é que, anos atrás, quando eu era muito ativo em vários fóruns e grupos de TI, eu irritava algumas pessoas e de vez em quando eu recebia vários tipos de ataques em meu servidor, incluindo spam de e-mail. . Mas naquela época os idiotas não eram tão inteligentes assim:)