Como exibir TSV (csv) no console, quando as células vazias são perdidas por: 'column -t -s $' \ t ''

11

Eu tenho um arquivo com colunas divididas com tab .

Eu tenho arquivo quando algumas linhas têm células vazias (no início, no meio).

Nesses casos, column -t -s $'\t' simplesmente falha:

Entrada:

$ echo -e 'A\tB\tC\tD\n\tb1\t\td1\n\t\t\td2\na3\t\t\td3' > in.tsv
$ hexdump -C in.tsv 
00000000  41 09 42 09 43 09 44 0a  09 62 31 09 09 64 31 0a  |A.B.C.D..b1..d1.|
00000010  09 09 09 64 32 0a 61 33  09 09 09 64 33 0a        |...d2.a3...d3.|
0000001e

saída da coluna:

$ cat in.tsv | column -t -s $'\t'
A   B   C  D
b1  d1
d2
a3  d3

em vez de:

A       B       C       D
        b1              d1
                        d2
a3                      d3

Você poderia recomendar como fazer a formatação da linha de comando TSV? (no caminho Unix, eu quero canalizar a saída do programa no formatador, como column )

Qualquer forma de "consertar" column abordagem? Talvez outra ferramenta?

    
por Grzegorz Wierzowiecki 13.01.2012 / 13:43

2 respostas

11

Você pode usar apenas o column do Debian. Ele fornece a opção -n , que faz com que funcione exatamente como você deseja.

Como alternativa, você pode colocar um espaço nas colunas vazias usando sed :

sed ':x s/\(^\|\t\)\t/ \t/; t x' < in.tsv | column -t -s $'\t'

exemplo:

$ sed ':x s/\(^\|\t\)\t/ \t/; t x' < in.tsv | column -t -s $'\t'
A   B   C  D
    b1     d1
           d2
a3         d3
    
por 13.01.2012 / 15:14
0
sed 's/||/| |/g;s/||/| |/g' filename-here

O comando acima é para pipe, então substitua-o por tabspace.

Você só precisa substituir as colunas vazias por um espaço em branco e canalizar a saída para o comando que você já está usando.

    
por 20.08.2014 / 20:14