Como copiar texto automaticamente de diferentes sites

4

Eu quero saber como copiar automaticamente o texto de diferentes sites. Eu estou construindo uma base de dados de empresas que pertencem a certas associações. O site tem uma lista de empresas com a descrição de cada uma delas que eu estou copiando manualmente. Existe uma maneira de criar uma macro e fazer isso automaticamente, uma vez que está repetindo o mesmo processo várias vezes.

Ou alguém sabe em qual idioma eu poderia desenvolver algo semelhante? Obrigado,

    
por BDstat 24.02.2017 / 10:23

2 respostas

2

Você está procurando uma técnica chamada web scraping . Você pode usar isso para coletar dados de sites que não oferecem APIs para obter os dados. Há muitas ferramentas para isso e também há muitas bibliotecas para diferentes idiomas (por exemplo, há BeautifulSoup para python). Cuidado, você pode se deparar com problemas legais quando estiver raspando / martelando um site constantemente sem permissão.

    
por 24.02.2017 / 10:33
2

Nas "Recomendações de software", há lista de bons aplicativos de raspagem da Web , todos eles podem fazer o que você precisa.

Se você está apenas começando com a captura de tela, as ferramentas com um gravador podem ser as melhores. Isso evita a criação de todos os seletores manualmente. Mas não há solução que magicamente funcione com todos os sites, até mesmo as ferramentas com um gravador requerem muitas vezes ajustes para cada página.

    
por 24.02.2017 / 14:08