Gostaria de saber se existe uma ferramenta de linha de comando para fazer isso:
Take as input an arbitrary MIME email and output a best-effort guess at a plain-text version of the email message.
Aqui está a minha justificativa para o motivo de ser um problema complicado. Se soubéssemos que um email foi codificado em HTML, poderíamos usar, por exemplo, lynx -dump ou html2text. Mas nem sempre podemos dizer com certeza se é esse o caso, ou mesmo se pudermos, pode ser uma mensagem multiparte / alternativa com uma seção de texto simples, caso em que não está claro para mim quando devemos confiar na planilha do remetente. versão de texto versus converter a parte html nós mesmos. E, além de tudo isso, com e-mails arbitrários com várias partes, nem sempre é fácil identificar a parte da mensagem para começar.
Por tudo isso, não estou pedindo uma ferramenta que funcione perfeitamente em todos os e-mails, apenas um que dê o melhor de si e funcione melhor do que se eu mesmo tentasse escrever um programa desses.
Parece-me que tal código deve existir em muitos lugares onde vários clientes de email fazem isso, mas a pesquisa não encontrou nenhuma ferramenta para resolver esse problema ...
Tags text-processing text email