Como comparar duas colunas de dois arquivos diferentes

0

Eu tenho dois arquivos. O primeiro contém algo como:

a.com,5,some,text
b.com,10,some,text
c.com,5,some,text
d.com,12,some,text
e.com,5,some,text
c.com,5,some,text

O segundo contém algo como:

c.com,5,some,text
d.com,12,some,text
a.com,5,some,text
b.com,10,some,text
e.com,5,some,text
c.com,5,some,text

Eu quero classificar, comparar as duas primeiras colunas dos dois arquivos. Eu suponho que eles deveriam ser semelhantes. Se houver alguma diferença, quero saber onde está a diferença?

    
por user9371654 08.06.2018 / 09:39

1 resposta

0

No Bash:

diff <(sort file1 | cut -d , -f 1-2) <(sort file2 | cut -d , -f 1-2)

Mas diff verá apenas duas colunas, portanto, sua saída (se houver uma diferença) será limitada a elas. Eu não sei se isso é aceitável para você.

Essa solução simples falhará se os arquivos tratarem de vírgulas, citações etc. Nesse caso, ferramentas mais especializadas devem ser usadas (por exemplo, importar os arquivos para uma planilha e trabalhar lá).

    
por 08.06.2018 / 10:02