Perguntas sobre 'screen-scraping'

1
resposta

Web scraper para o Outlook Web App 2010?

Estou usando weboutlook há anos com grande sucesso, mas recentemente mudamos do 2007 para o 2010 versão do Outlook Web App (OWA). Alguém sabe de um raspador que funciona com a versão mais recente?     
10.10.2011 / 15:50
4
respostas

Existe um plugin do Firefox ou do Chrome para salvar automaticamente as imagens da página da Web?

Um site tem um slideshow de imagens, por exemplo: Este link Como a apresentação de slides é automática, existe alguma maneira de salvar essas imagens automaticamente em uma pasta? por um plugin de navegador ou por algumas linguagens de script?...
12.08.2011 / 01:22
3
respostas

Salvar partes de um site como texto puro

Espero poder perguntar isso aqui. Eu preciso extrair o conteúdo de um site existente (responsável pelo dono do site) para documentos do Word (ou texto). Para isso, eu só preciso do conteúdo de um DIV com um determinado ID. Existe alguma fe...
23.11.2009 / 15:41
0
respostas

Como colar títulos HTML no Excel

Em uma resposta anterior ( tabela vba-html para a planilha do Excel ) sobre a análise / colagem do conteúdo da tabela HTML em uma planilha do Excel, o wbeard2 compartilhou este pedaço de código muito útil e ilustrativo. Ele / ela nota que implan...
01.06.2018 / 03:18
1
resposta

Como eu uso o AutoHotKey para ler o texto no local do mouse?

Eu posso ler o texto da janela inteira usando WinGetText (), mas estou tentando obter o texto no local atual do mouse. Encontrei vários exemplos nos fóruns do AutoHotKey, mas eles são todos muito antigos (de 2007 a 2009) e as amostras não fun...
13.02.2013 / 03:53
0
respostas

página de estilo do Googleigo com conteúdo extraído de outras páginas

Estou procurando uma página inicial on-line ou uma extensão do Chrome que exiba uma página inicial do tipo iGoogle, mas que permita selecionar o conteúdo de outras páginas. Da mesma forma, o AdBlock permitirá que eu selecione um div para bloquea...
09.11.2012 / 14:17
1
resposta

Método de raspagem alternativo e mais eficiente para um noncoder, do que o importxml e xpath do Google doc?

Eu pesquisei em toda a rede para uma solução simples, mas parece que todo mundo tem seu próprio método exclusivo (linguagem de codificação) de conseguir isso. Estou apenas começando a aprender Linux, e minhas habilidades de codificação estão comp...
13.04.2012 / 06:37
3
respostas

Estou vendo arquivos PNG animados em alguns sites em vez de GIFs. Como posso salvar / fazer download deles?

Eu sei como salvar um GIF, é super fácil. Basta clicar com o botão direito e salvar. Voila! Mas com esses novos PNG animados, eu não tenho a menor dúvida. Sem usar algum tipo de tela onde eu estou pegando toda a área de trabalho, eu nem tenho ce...
17.11.2017 / 07:54
1
resposta

Um site pode distinguir entre um web scraper e um usuário legítimo em uma base diferente da velocidade de passagem? [fechadas]

Se eu reduzir a velocidade de um raspador da Web para corresponder à velocidade de um ser humano, um terceiro poderá diferenciá-lo? Quais outros critérios os sites usam para distinguir entre usuários e scrapers     
23.04.2018 / 08:11
1
resposta

Httrack filtra links com determinado padrão

Estou tentando usar o httrack para fazer o download de um webarchive inteiro do archive.org. A ideia é baixar apenas os links do arquivo (o máximo possível), mas apenas os links que são realmente do arquivo e não do site atual. Em outras palavra...
27.03.2015 / 10:05