Como “legal” é o site-scraping usando cURL? [fechadas]

11

Recentemente eu estava experimentando com a cURL, e achei muito possível com isso. Eu construí um pequeno script que rastreia um site musical, que toca músicas online. No caminho do meu experimento, descobri que também é possível rastrear a fonte da música ... (esse site não fornece download).

Eu só o que saber .. É totalmente legal rastrear os sites? Eu quero dizer usando http and port '80' ,

Existem perdidos de gerenciadores de downloads disponíveis no mercado, eles podem baixar de quase todos os sites .. são todos válidos e legais.

    
por Chetan Sharma 23.08.2010 / 06:06

4 respostas

13

A resposta é exatamente sua pergunta sim. A única exceção possível é a criptografia no seu país, se o cURL foi criado com suporte a SSL vinculado estaticamente ou se você está exportando dos EUA para um dos poucos países considerados hostis.

Raspagem de páginas da Web visíveis publicamente em um site também é legal, geralmente. Se você baixar uma cópia de cada uma das páginas que você pode ver no seu navegador, você não terá nenhum problema. Se você começar a causar problemas para outros usos, isso pode ser considerado um ataque de negação de serviço. Talvez você também precise verificar os termos e condições do site, mas como você já fez o download para visualizá-lo, não há muita diferença (na melhor das hipóteses, é um tecnicismo sutil).

Baixar música, no entanto, é apenas isso. Não importa se você usa Limewire, uTorrent, Megaupload, Flashget ou cURL, você ainda está baixando músicas. Isso é legal se o artista / gravadora disser que é, se você possui uma licença, ou geralmente se você tem permissão legal para fazê-lo.

Então, cURL é completamente legal. Mas, como qualquer outra coisa, o que você faz com isso pode não ser.

    
por 23.08.2010 / 06:19
3

O IMDB.com proíbe explicitamente o uso de scrappers como este em seu site como parte de seus termos de serviço.

    
por 23.08.2010 / 07:24
3

Não posso comentar as respostas, pois não tenho representante aqui, mas várias respostas afirmaram que talvez não seja legal, dependendo dos termos de serviço do site. E esta é uma tecnicidade sutil, mas se for esse o caso, então ainda é legal, mas você pode ser processado civilmente por quebra de contrato ou violações de direitos autorais (embora as violações de direitos autorais também possam ser criminalmente ilegais). Mas, em geral, só porque o TOS de um site diz que você não pode fazer algo, não significa que ele tenha a autoridade legal de impedir que você o faça.

    
por 23.08.2010 / 11:15
1

Geralmente, é mais importante o que você faz com ele e, em seguida, como você o adquire. Ou seja, você pode copiar um CD, mas o que você fez com esse CD? Você o vendeu para alguém (ilegal) ou simplesmente o colocou em uma prateleira em cima do seu CD antigo para que você tenha uma cópia não arranhada (legal). Da mesma forma, mesmo quando você é dono da música, você ainda tem o direito de copiá-la para seu próprio uso, nem mesmo para outros usuários.

Aqui está uma pergunta. Geralmente, quando se trata de internet, se é "publicado" por alguém com direitos para publicá-lo, e não há qualquer estipulação de que ele não é livre para usar (ou seja, um TOS), então, geralmente, é considerado um jogo justo usá-lo de maneira não comercial. Mas, e se o conteúdo não fizer parte da parte "visível" da página da Web e exigir que a captura de fontes e a navegação em pastas adquiram / acessem. Embora possa estar em uma rede "pública" e acessível por meios não seguros. É quase como reivindicar que você pode roubar a casa de alguém porque eles deixaram a porta aberta, o que é um pouco como uma analogia, mas válida até certo ponto. Se não houver links na página, pode-se argumentar que o conteúdo não foi "publicado" e, portanto, você nunca teve direitos para acessá-lo.

Mas isso é provavelmente muito barulho por nada, se você não está fazendo nada maluco, ou tentando lucrar com o trabalho de outras pessoas, então geralmente ninguém se importa se você arranja algo.

    
por 23.08.2010 / 11:01