Regex para combinar = seguido por uma nova linha para que ambos sejam excluídos

2

Estou trabalhando com o conteúdo de origem bruto de uma mensagem mail.app no OSX, mas resulta em um texto com codificação MIME Email para impressão. então eu preciso remover todos esses caracteres estranhos para obter o HTML correto.

Aqui está um exemplo:

<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&amp;utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>

Aqui eu tenho = CRLF e = 3D

Eu sei como substituir todos esses caracteres = C3 = A1 = C3 = C3 = C3 = C3 = C3 = C3 = C3 = C3 = C3 = C3 = 9A = C3 = B1 = C3 = 91 = 3D = f

Só preciso excluir this = CRLF ou '=' seguido por uma nova linha.

    
por I. Nadir Palacios 17.11.2015 / 04:41

1 resposta

1

Por que reinventar a roda? qprint já existe:

Description-en: encoder and decoder for quoted-printable encoding

Qprint is a command-line program that can encode or decode files from/to quoted-printable encoding (RFC1521). It can work with both text and binary data.

Homepage: http://www.fourmilab.ch/webtools/qprint/

Exemplo de entrada:

$ cat nadir.txt 
<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&amp;utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>

Exemplo de saída:

$ qprint -d nadir.txt 
<p style="margin:1em 0 3px 0;">
<a name="1" style="font-family:Arial, Helvetica, sans-serif;font-size:18px;" href="http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm_source=feedburner&amp;utm_medium=email">Hyundai ya ofrece manuales de los coches con Realidad Aumentada</a>
</p>

qprint está disponível pré-empacotado para a maioria das distribuições Linux.

Existem também vários módulos perl para codificação de & decodificação de texto para impressão entre aspas, incluindo MIME::QuotedPrint e PerlIO::via::QuotedPrint . Sem dúvida, uma pesquisa rápida no google também revelaria bibliotecas QP para python e outros idiomas.

    
por 17.11.2015 / 04:50