Como posso mostrar o número de posições que as linhas moveram na saída do diff?

Question

Como posso mostrar o número de posições que as linhas moveram na saída do diff?

#1 resposta do (4 votos)
#2 resposta do (2 votos)

2

top1

1,facebook.com
2,google.com
3,youtube.com
4,yahoo.com
5,wikipedia.org
6,baidu.com
7,live.com
8,amazon.com
9,qq.com
10,twitter.com

top2

1,facebook.com
2,google.com
3,youtube.com
4,yahoo.com
5,baidu.com
6,wikipedia.org
7,live.com
8,qq.com
9,amazon.com
10,twitter.com

diff -u  /Users/stofke/Desktop/top2a.csv /Users/stofke/Desktop/top1a.csv |
  sed -n '1,2d;/^[-+]/p' |
  sort --field-separator=',' --key=2 

+9,amazon.com
-8,amazon.com
+5,baidu.com
-6,baidu.com
+8,qq.com
-9,qq.com
+6,wikipedia.org
-5,wikipedia.org

Mas eu realmente preciso disso:

 +1, amazon.com
 -1  baidu.com
 -1  qq.com
 +1  wikipedia.org

Eu não sei como fazer esse último passo

(Eu também precisaria calcular o percentual de declínio ou aumento sábio)

Adicionando | paste -d, - -

me pega isso

+9,amazon.com,-8,amazon.com
+5,baidu.com,-6,baidu.com
+8,qq.com,-9,qq.com
+6,wikipedia.org,-5,wikipedia.org

bash diff csv

por Stofke 20.01.2013 / 17:05

2 respostas

4

Usando o awk

awk -F, '
    NR == FNR {n[$2] = $1; next}
    {n[$2] -= $1}
    END {for (k in n) if (n[k] != 0) printf " %2d  %s\n",n[k],k}
' top1 top2

saídas

 -1  amazon.com
  1  qq.com
 -1  wikipedia.org
  1  baidu.com

pedido não garantido.

por 20.01.2013 / 18:38

Tags bash diff csv

Use uma interface específica para uma sub-rede de destino específica (configuração de IP de origem) Existe um excelente tutorial sobre como redimensionar uma partição rootfs (e reduzir outra) em uma unidade que é 100% alocada?

score 2 · Accepted Answer

Você também pode considerar uma abordagem usando join , já que deseja a saída classificada no final. Como:

join -t, -j2 <(sort -t, -k2 file1) <(sort -t, -k2 file2) |
   awk -F, '{n=$3-$2; if (n) print n, $1}'