Como exportar citações do Google Alerts?

1

Tenho vários meses de Alertas do Google no meu e-mail e gostaria de compartilhá-los em algum lugar na Web (por exemplo, em um wiki do MediaWiki). Existe uma maneira fácil de exportá-los?

Os alertas contêm HTML deste tipo (visto do Thunderbird):

<div style="color:#fff;font-size:9px;letter-spacing:0.8px"> <div style="padding:3px 0px 4px 4px;background:rgb(255,255,255);background-color:rgba(0,0,0,0.5);width:96px">La Provincia di Biella</div> </div> <!--[if gte mso 9]></div><![endif]--> </td> </tr> </table> </a> <div>  <span style="padding:0px 6px 0px 0px"> <a href="https://www.google.com/url?rct=j&amp;sa=t&amp;url=http://www.laprovinciadibiella.it/web/castelletto-cervo-nei-siti-cluniacensi-9458&amp;ct=ga&amp;cd=CAEYACoTMzc2NjcxMzA4NDYzNjc4NjUwMjIZZThjOGE1NjBlZjA5ZDRkMDppdDppdDpJVA&amp;usg=AFQjCNEW4QKACEvE_AbGrMGOBJ2y4dFSIw" style="color:#427fed;display:inline;text-decoration:none;font-size:16px;line-height:20px">Castelletto Cervo nei siti cluniacensi</a> </span>  <div> <div style="padding:2px 0px 8px 0px"> <div style="color:#737373;font-size:12px"> <a style="text-decoration:none;color:#737373">La Provincia di Biella</a> </div>
    
por Nemo 31.10.2015 / 18:39

1 resposta

0

Esta funcionou para mim :

  1. faça o download dos alertas do seu email em um diretório do Thunderbird;
  2. instale o plug-in ImportExportTools e exporte todo o diretório como HTML;
  3. vá para o diretório de exportação e execute: find * -print0 | xargs -0 -I § bash -c 'NAME="§"; DATE="{{#time:j F Y| ${NAME:0:8} }}"; grep --text -Eo "ru=([^&]+)&amp;" "§" | sed "s,ru=,;$DATE:,g" | sed "s,&amp;,,g" ; ' | sort -ru

Eu usei ;$DATE: como prefixo para cada URL porque isso é um wikitexto significativo e as funções do analisador permitem uma fácil tradução o formato "AAAAMMDD" usado pelos arquivos de exportação. Você pode substituir com qualquer coisa.

Uma versão mais inteligente pode enviar o URL para o Zotero ou o Citoid para obter uma citação adequada, ou talvez analisar o HTML original para extrair mais informações. O formato HTML parece ser diferente para alertas antes de 2014-01-18.

Testado com GNU findutils 4.5.12, bash 4.3.42.

TODO: faça o download dos links "veja mais artigos" e analise-os também. Em dias atarefados, os e-mails contêm apenas uma seleção aleatória das notícias "principais".

    
por 31.10.2015 / 18:39