Excluindo delimitadores delimitados por corte

Question

#1 resposta do (5 votos)
#2 resposta do (4 votos)
#3 resposta do (4 votos)
#4 resposta do (2 votos)

5

Digamos que eu tenha um arquivo CSV:

"col1","col2","col3"
"col4","col5,subtext","col6

O problema que tenho é o seguinte:

cut -d, -f1,2 test.txt
"coll1","col2"
"col4","col5

A saída desejada é:

"col1","col2"
"col4","col5,subtext"

text-processing shell-script cut

por Little Code 27.10.2016 / 12:35

4 respostas

4

Exemplo:

gawk -vFPAT='[^,]*|"[^"]*"' '{print $1 "," $2}' test.txt

por 27.10.2016 / 12:41

4

Outra solução perl , assumindo que todos os campos são citados

$ perl -F'/"\K,(?=")/' -lane 'print "$F[0],$F[1]"' test.txt 
"col1","col2"
"col4","col5,subtext"

O separador de campo -F'/"\K,(?=")/' é apenas vírgula se for precedido por " e seguido por "
print "$F[0],$F[1]" imprime os dois primeiros campos separados por ,

Pode ser feito com grep também

$ grep -oE '^"[^"]*","[^"]*"' test.txt 
"col1","col2"
"col4","col5,subtext"

Se N campos forem necessários, use grep -oE '^("[^"]*",){1}"[^"]*"' , onde o número dentro de {} é N-1

por 27.10.2016 / 13:56

2

você também pode tentar isso com awk como abaixo;

awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt

Por exemplo;

user@host$ awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt 
"col1","col2"
"col4","col5,subtext"

por 27.10.2016 / 12:50

score 5 · Accepted Answer

O módulo ParseWords, que acompanha o Perl, aborda isso com bastante elegância. Exemplo abaixo.

$ perl -MText::ParseWords -nE '@a=quotewords ",",1,$_;say $a[0],",",$a[1]' <test.txt
"col1","col2"
"col4","col5,subtext"
$