Compare linhas independentes em dois arquivos [fechados]

1

Eu tenho dois arquivos, cada um com 500k + contas de usuário. Eu preciso encontrar as diferenças entre os dois (as contas em falta / delta). Cada arquivo está em um formato simples, cada linha contém um endereço de e-mail em cada arquivo.

Eu classifiquei por único e alfabético. Agora precisa encontrar o delta. Não consigo descobrir como fazer isso no Linux (Red Hat). Tudo quer comparar linha por linha.

Em file1 :

[email protected]
[email protected]
[email protected]
[email protected]

em e em 500k contas. Em file2 :

[email protected]
[email protected]
[email protected]
[email protected]
[email protected]

em e em mais de 300k contas. etc etc.

    
por sectech33 17.03.2016 / 19:32

1 resposta

2

Como mencionado nos comentários, o que você está pedindo é exatamente o que comm faz. Execute comm -32 file1 file2 para ver as linhas em file1 que não estão presentes em file2 ou comm -31 file1 file2 para ver as linhas em file2 que não estão presentes em file1 ou comm -3 file1 file2 para ver as linhas que estão presentes apenas em um dos arquivos, com as linhas exclusivas para file2 recuadas por uma guia.

Observe que comm exige que sua entrada seja classificada. Se você já tiver arquivos classificados, verifique se eles estão classificados na mesma localidade .

    
por 18.03.2016 / 01:21