Que extensão de arquivo tem um arquivo delimitado por tabulação?

17

Os arquivos delimitados por vírgulas geralmente possuem uma extensão de arquivo de .csv . Qual extensão de arquivo deve ter um arquivo delimitado por tabulação? Ao fazer uma exportação do Excel, ele salva como .txt ao selecionar a guia delimitado, mas não tinha certeza se esse era o padrão. Obrigado.

    
por Chad Harrison 04.04.2013 / 14:55

2 respostas

12

Eu vi os dois tsv e txt usados, mas entre os dois, mais comumente vi arquivos delimitados por tabulações salvos como txt .

    
por 04.04.2013 / 14:56
21

Não há uma resposta única e correta.

Nunca houve um registro centralizado de extensões de arquivos, portanto, a seleção de extensões de arquivo sempre foi uma questão de convenção, a menos que o software impusesse restrições. Nos dias do DOS, o uso de extensões de arquivo padronizadas (conhecidas) tornou-se predominante apenas para formatos proprietários (como .WKS do Lotus 1-2-3 e .DBF do dBaseII / III), porque o próprio software exigia um (você não tinha escolha), ou sugeriu strongmente a extensão do arquivo. Para formatos que não tinham nenhum aplicativo específico associado a eles, cabia realmente ao usuário escolher.

Mesmo assim, alguns programas com formatos proprietários (como o WordStar) não usavam extensões de arquivo padronizadas. Era comum os usuários do WordStar usarem .LET para letras, .DOC para documentos grandes, .INV para faturas, .TXT para texto indeterminado e assim por diante. Se você obtivesse um arquivo .DOC , não teria como saber que tipo de arquivo era sem contexto ou despejá-lo para ver como era o arquivo. Poderia ter vindo de dezenas e dezenas de programas literalmente, ou poderia ser apenas um arquivo de texto simples. Uma extensão de arquivo .BAK (back-up) simplesmente informou que "este arquivo anteriormente tinha uma extensão de arquivo diferente". Um arquivo .BAS era quase certamente algum tipo de arquivo de código BASIC , mas poderia ter sido para MS-Basic, Turbo Basic ou de qualquer outro concorrente. Muitas vezes, os arquivos não eram salvos com uma extensão (você sabia o que eram por causa do rótulo no disquete que os mantinha). Algumas pessoas pediram a "extensão" e usaram os caracteres de extensão para que seus nomes de arquivos pudessem ter até 11 caracteres em vez do padrão 8 (por exemplo, " MikeJohn.son ") ou usassem a extensão como número serial ou de versão ( MathPapr.001 MathPapr.002 , etc.)

As coisas começaram a mudar com o Windows; Eu suspeito principalmente porque o Windows incentivou extensões de arquivo a serem associadas a programas individuais no registro WIN.INI < Portanto, os redatores do programa tinham realmente um strong incentivo para usar e assumir o controle de uma extensão de arquivo distinta (embora nem sempre com uma sigla sensata). Uma pequena guerra se seguiu para ver quem tinha extensões de arquivo comuns - como .DOC (você sabe quem ganhou essa).

Mantenha esse contexto em mente:

Para arquivos de texto, o Bloco de notas assumiu .TXT , o que era muito comum na época. Outros programas poderiam abri-lo, é claro; e com o tempo, quando você poderia registrar vários editores para uma extensão, muitos programas o fizeram. No entanto, o importante é que isso solidificou seu significado atualmente aceito: "um arquivo de texto simples, sem formatação ou marcação de qualquer tipo, exceto possivelmente guias e terminadores de linha".

O que chamamos hoje de arquivos "Comma-Separated Values", normalmente eram armazenados com uma extensão .TXT , porque eram - bem - arquivos com texto simples. O Excel apareceu e precisou suportar valores em arquivos de texto em que cada coluna foi separada por uma vírgula, então eles criaram .CSV como uma extensão de arquivo que puderam registrar - e ficou preso (pode ter havido um precedente histórico de usar .CSV . Eu não estou ciente de nenhum).

Engraçado, arquivos de "valores separados por abas" nunca foram muito comuns em DOS ou Windows, por quê? meu palpite: era muito difícil para muitos usuários do DOS entenderem ou trabalharem com guias. Era um caractere de controle herdado do conjunto de controle ASCII destinado a teletipos; formalmente não era um personagem imprimível. O gerador de caracteres de PC da IBM tinha um gráfico para isso, mas para obtê-lo você tinha que gravar diretamente na placa de vídeo para que ninguém realmente o usasse. Seu significado exato não foi padronizado. Se você renderizar o arquivo na tela ou imprimi-lo, os usuários não poderão "ver" ou distingui-lo dos espaços planejados. Muitos / a maioria dos editores não conseguiram inseri-lo.

Então, ninguém mordeu a isca. Ninguém pegou "arquivos com valores separados por tabulações" e criou uma extensão de arquivo que se tornou "padrão", em virtude de domínio personalizado ou de mercado.

.TXT é provavelmente a extensão de arquivo mais comum. .TSV é uma ótima opção se você precisar de algo diferente de .TXT . Eu também vi e usei .TAB de vez em quando.

    
por 04.04.2013 / 16:14