método para subtrair strings de texto comuns em dois arquivos?

0

Eu tenho dois arquivos de texto, um com 100.000 strings e outro com 1.000 strings, que já estão presentes no arquivo maior. Eu gostaria de subtrair essas 1.000 strings, para que o arquivo maior contenha apenas 99.000. Não se trata de remover duplicatas, e sim de remover strings.

Existe um comando para fazer isso?

    
por george 28.04.2014 / 02:36

1 resposta

0

Se as strings estiverem em linhas separadas, você pode usar gre de MSYS ou cygwin da seguinte forma:

C:\> grep -v -f thousandLine.txt hundred000line.txt >ninetynine000Line.txt

A opção -v inverte a correspondência para que a saída seja todas as linhas em hundred000line.txt que não correspondem a nenhuma linha em thousandLine.txt . Consulte o manual do grep para obter mais informações.

    
por 28.04.2014 / 12:28