Resultado truncado retornado por JOIN

4

Estou usando o comando join no linux, mas os resultados variam entre máquinas diferentes. Eu tenho dois arquivos simples:

cat 1.txt  
a aaa,0.2
b bbb,0.3
c ccc,0.5

cat 2.txt
a aaa,0.2
b bbb,0.3
c ccc,0.6

Estou executando o seguinte comando

join -a 1 -1 1 -2 1 -t "," -o 1.1' '1.2' '2.2 <(cat 1.txt| sort -t ",") <(cat 2.txt| sort -t ",") 

Resultado na máquina 1:

,0.2a,0.2
,0.3b,0.3
,0.6c,0.5

join --version
join (GNU coreutils) 8.13

locale
LANG=en_US.UTF-8
LANGUAGE=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8

Resultado na máquina 2:

a aaa,0.2,0.2
b bbb,0.3,0.3
c ccc,0.5,0.6

join --version
join (GNU coreutils) 5.97

locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

Claramente, o resultado na primeira máquina está errado. Foi truncado. Eu tentei usar diferentes configurações de localidade, mas não tive sucesso.

    
por Mathskiller 03.09.2014 / 20:48

1 resposta

3

Corrija seus arquivos com dos2unix ou, se não estiver instalado:

sed -i 's/\r$//' {1,2}.txt 
    
por 04.09.2014 / 02:11