Onde posso encontrar um bom script de verificação de plágio? [fechadas]

1
Estou escrevendo uma dissertação para o meu projeto de último ano e sei que, independentemente do que eu escreva, haverá semelhanças com coisas que estão por aí na web e em periódicos acadêmicos e livros. Felizmente para a maioria do Google pode erradicar a maioria destes com facilidade para encontrar um script de verificação de plágio livre não deve ser muito difícil.

Depois de pesquisar um pouco, deparei com alguns verificadores realmente básicos, mas a maioria deles são "versões básicas" que exigem que alguém pague por um script que realmente funciona ou que geralmente é inútil. Eu encontrei um que parece funcionar bem para pequenos pedaços de dados, mas falha miseravelmente quando entregue um arquivo grande.

Tudo o que quero fazer é poder carregar um documento do Word (ou apenas inserir texto se não houver opções de upload disponíveis) e me informar o que parece ser copiado e de onde. Alguém sabe de algum verificador de plágio que possa ser baixado gratuitamente ou rodar on-line?

EDIT: Só para esclarecer minhas necessidades, eu quero uma ferramenta que possa pegar um documento do Word e pesquisá-lo em sua totalidade para que ele possa rotular qualquer instância em que o documento corresponda a outro documento no Google.

    
por Mike B 22.12.2009 / 02:32

5 respostas

1

Há muitas boas sugestões aqui, mas o consenso geral é que não existem ferramentas disponíveis que possam fazer o que eu quero. Apesar disso, decidi continuar usando a versão básica do The Plagiarism Checker . Funciona quase exatamente como eu quero, embora para obter alguns dos melhores recursos que eu precisaria pagar.

Essa ferramenta usa a API do Google e encontra o texto copiado extremamente bem, e eu já encontrei duas instâncias em que escrevi frases semelhantes a alguns artigos.

Como outros listaram outros ótimos exemplos, posso escrever meu próprio roteiro para fazer o que eu quero, já que tenho experiência de trabalho com a API do Google e parece que esse é o melhor script disponível no momento, com alguns deles scripts e técnicas sendo os melhores para seus próprios usos.

    
por 22.12.2009 / 17:04
4

Eu não acho que você encontrará uma solução real na forma de um script ou de um aplicativo gratuito. Pense no que você quer que o programa faça: leia um documento e verifique - o que? (O trabalho publicado de outras pessoas? Isso requer um grande banco de dados de obras publicadas. Variação estilística além de alguma norma estatística? Isso requer uma norma estatística para o estilo (provavelmente baseado no vocabulário e duração da sentença computada em relação a palavras significativas - ex. ',' ou ',' to ',' for 'etc.) Estes não são requisitos triviais ou algo que você pode juntar em algumas centenas de linhas de linguagem insert-your-scripting-here |.

Muitas escolas usam Turnitin e muitas escolas usam o Google para pesquisar trabalhos publicados. Esse método é imprevisível, por razões óbvias. O TurnItIn não é gratuito, e o Google é uma solução muito imperfeita, mas essas são as duas soluções que vejo com mais frequência.

    
por 22.12.2009 / 02:50
2

A Universidade da Virgínia disponibiliza esta ferramenta: Copyfind .
Tanto a fonte quanto o executável estão disponíveis para download.

This program examines a collection of document files. It extracts the text portions of those documents and looks through them for matching words in phrases of a specified minimum length. When it finds two files that share enough words in those phrases, copyfind generates html report files. These reports contain the document text with the matching phrases underlined.

What copyfind can do: It can find documents that share large amounts of text. This result may indicate that one file is a copy or partial copy of the other, or that they are both copies or partial copies of a third document.

What copyfind cannot do: It cannot search for text that was copied from any external source, unless you include that external source in the documents you give to copyfind. It works on only purely local data it cannot search the web or internet to find matching documents. If you suspect that a particular outside source has been copied, you must create a local document containing that outside material and include this document in the collection of documents that you give to copyfind.

Para verificações na web, você pode dar uma olhada:
Sistema de Detecção de Plágio Gratuito Online, Verificador de Plágio

    
por 22.12.2009 / 10:13
1
Recentemente eu pesquisei alguns desses verificadores de plágio on-line e descobri que a maioria desses sites gratuitos está usando a API do Yahoo para verificar o plágio no back-end. Embora eu tenha encontrado esta visão geral muito boa, estou pessoalmente usando o Google mais dos tempos, como os resultados superam significativamente os pelos sites baseados no Yahoo API.

    
por 08.11.2013 / 11:12
0

Plagiarism-Checker de architshukla no github é um plágio (principalmente) de código aberto script de verificador escrito (principalmente) em python, que adverlyly / supostamente usa o google api para n-gram verificar documentos.

Eu não testei, mas talvez você possa conferir. O objetivo é trabalhar no Windows e no Linux.

    
por 06.01.2014 / 00:44

Tags