Corrija seus arquivos com dos2unix
ou, se não estiver instalado:
sed -i 's/\r$//' {1,2}.txt
Estou usando o comando join no linux, mas os resultados variam entre máquinas diferentes. Eu tenho dois arquivos simples:
cat 1.txt
a aaa,0.2
b bbb,0.3
c ccc,0.5
cat 2.txt
a aaa,0.2
b bbb,0.3
c ccc,0.6
Estou executando o seguinte comando
join -a 1 -1 1 -2 1 -t "," -o 1.1' '1.2' '2.2 <(cat 1.txt| sort -t ",") <(cat 2.txt| sort -t ",")
Resultado na máquina 1:
,0.2a,0.2
,0.3b,0.3
,0.6c,0.5
join --version
join (GNU coreutils) 8.13
locale
LANG=en_US.UTF-8
LANGUAGE=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8
Resultado na máquina 2:
a aaa,0.2,0.2
b bbb,0.3,0.3
c ccc,0.5,0.6
join --version
join (GNU coreutils) 5.97
locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
Claramente, o resultado na primeira máquina está errado. Foi truncado. Eu tentei usar diferentes configurações de localidade, mas não tive sucesso.
Tags text-processing join linux