Exclusivo Delimitador quando o ponto-e-vírgula foi substituído por vírgula em arquivos CSV de ambientes Unix?

0

O Azure Machine Learning me insiste para usar a vírgula como deliminador em arquivos CSV, em vez de ponto-e-vírgula. Isso quebra muitas coisas em computadores * x onde usamos ponto-e-vírgula e os valores das células têm muitas vírgulas.

Quais são as formas adequadas de escapar de caracteres ou substituir todas as vírgulas nas células? Existem algumas ferramentas do Unix para escapar ou ajudar neste problema de formato e possíveis conversões?

    
por hhh 25.01.2017 / 20:11

1 resposta

1

Se você tiver vírgulas nos campos, o arquivo CSV gerado deverá produzir uma maneira de delinear os campos dessas vírgulas. Por exemplo, isso geralmente é feito colocando aspas em torno desses campos:

"field,1","field,2"

Caso contrário, não há como saber o que separa um campo do que faz parte desse campo. Esse problema existe, não importa qual personagem você escolha.

Você pode pesquisar e substituir esses itens pelo seu próprio caractere, se desejar, como no exemplo acima:

sed -e 's/","/"~"/g' csvfile
    
por 25.01.2017 / 21:22