Eu tenho vários arquivos CSV grandes e gostaria deles em TSV (formato separado por tabulação). A complicação é que existem vírgulas nos campos do arquivo CSV, por exemplo:
A,,C,"D,E,F","G",I,"K,L,M",Z
Resultado esperado:
A C D...
Eu tenho um texto de coluna delimitado por tabulações, como abaixo
A B1 B1 C1
B B2 D2
C C12 C13 C13
D D3 D5 D9
G F2 F2
como eu poderia converter a tabela acima, como abaixo...
Eu tenho um arquivo que contém texto da seguinte forma:
dt=2016-06-30,path=path1,site=US,mobile=1
dt=2016-06-21,path=path2,site=UK,mobile=0
Eu quero convertê-lo em texto com valores com aspas duplas nos pares de valores-chave, assim:
d...
Eu já encontrei "Como imprimir uma contagem incremental de ocorrências de valores únicos na coluna 1" , que é semelhante à minha pergunta, mas a resposta não é suficiente para meus propósitos.
Primeiro, deixe-me ilustrar o que eu quero faze...
Para determinar o comprimento máximo de cada coluna em um arquivo csv separado por vírgula, eu criei um script básico. Quando o executei em um sistema linux, ele produziu a saída correta, mas eu preciso que ele seja executado no OS X e se baseie...
Eu tenho um arquivo separado por tabulação TSV com 3 cols:
ID\tTEXT\tTYPE
Para imprimir a coluna TYPE que faço
cat /dataset.csv | awk -F $'\t' '{print $3}'
Esses valores são uma enumeração de valores como {CLASS_A,CLASS_B,CLASS...
Eu estava jogando com o IFS hoje e criei um arquivo de texto rápido com uma lista de números separados por vírgulas em uma linha.
1,2,3,4,5
Eu então tentei escrever um script para imprimir cada número em uma nova linha. Eu consegui fazer...
Eu tenho dois arquivos: 'file1' tem números de identificação de funcionário. 'file2' tem o banco de dados completo dos funcionários. Aqui está o que parecem:
arquivo1
123123
222333
arquivo2
111222 Jones Sally
111333 Johnson Roger
12...
Eu tenho um diretório (vamos chamá-lo de "Movies") que contém muitos arquivos e pastas. Eu tenho uma longa lista de nomes de arquivos em um arquivo .csv (cerca de 4000 entradas) que se referem a arquivos que estão localizados em algum lugar dent...
Estou analisando alguns logs de pacotes e queria fazer uma boa tabela com alguma saída, o que normalmente funciona bem quando uso column -t . Eu não posso usar uma tab como meu separador de campo de saída (OFS) neste caso porque ele ataca os c...