Eu vi os dois tsv
e txt
usados, mas entre os dois, mais comumente vi arquivos delimitados por tabulações salvos como txt
.
Os arquivos delimitados por vírgulas geralmente possuem uma extensão de arquivo de .csv
. Qual extensão de arquivo deve ter um arquivo delimitado por tabulação? Ao fazer uma exportação do Excel, ele salva como .txt
ao selecionar a guia delimitado, mas não tinha certeza se esse era o padrão. Obrigado.
Não há uma resposta única e correta.
Nunca houve um registro centralizado de extensões de arquivos, portanto, a seleção de extensões de arquivo sempre foi uma questão de convenção, a menos que o software impusesse restrições. Nos dias do DOS, o uso de extensões de arquivo padronizadas (conhecidas) tornou-se predominante apenas para formatos proprietários (como .WKS
do Lotus 1-2-3 e .DBF
do dBaseII / III), porque o próprio software exigia um (você não tinha escolha), ou sugeriu strongmente a extensão do arquivo. Para formatos que não tinham nenhum aplicativo específico associado a eles, cabia realmente ao usuário escolher.
Mesmo assim, alguns programas com formatos proprietários (como o WordStar) não usavam extensões de arquivo padronizadas. Era comum os usuários do WordStar usarem .LET
para letras, .DOC
para documentos grandes, .INV
para faturas, .TXT
para texto indeterminado e assim por diante. Se você obtivesse um arquivo .DOC
, não teria como saber que tipo de arquivo era sem contexto ou despejá-lo para ver como era o arquivo. Poderia ter vindo de dezenas e dezenas de programas literalmente, ou poderia ser apenas um arquivo de texto simples. Uma extensão de arquivo .BAK
(back-up) simplesmente informou que "este arquivo anteriormente tinha uma extensão de arquivo diferente". Um arquivo .BAS
era quase certamente algum tipo de arquivo de código BASIC
, mas poderia ter sido para MS-Basic, Turbo Basic ou de qualquer outro concorrente. Muitas vezes, os arquivos não eram salvos com uma extensão (você sabia o que eram por causa do rótulo no disquete que os mantinha). Algumas pessoas pediram a "extensão" e usaram os caracteres de extensão para que seus nomes de arquivos pudessem ter até 11 caracteres em vez do padrão 8 (por exemplo, " MikeJohn.son
") ou usassem a extensão como número serial ou de versão ( MathPapr.001
MathPapr.002
, etc.)
As coisas começaram a mudar com o Windows; Eu suspeito principalmente porque o Windows incentivou extensões de arquivo a serem associadas a programas individuais no registro WIN.INI
< Portanto, os redatores do programa tinham realmente um strong incentivo para usar e assumir o controle de uma extensão de arquivo distinta (embora nem sempre com uma sigla sensata). Uma pequena guerra se seguiu para ver quem tinha extensões de arquivo comuns - como .DOC
(você sabe quem ganhou essa).
Mantenha esse contexto em mente:
Para arquivos de texto, o Bloco de notas assumiu .TXT
, o que era muito comum na época. Outros programas poderiam abri-lo, é claro; e com o tempo, quando você poderia registrar vários editores para uma extensão, muitos programas o fizeram. No entanto, o importante é que isso solidificou seu significado atualmente aceito: "um arquivo de texto simples, sem formatação ou marcação de qualquer tipo, exceto possivelmente guias e terminadores de linha".
O que chamamos hoje de arquivos "Comma-Separated Values", normalmente eram armazenados com uma extensão .TXT
, porque eram - bem - arquivos com texto simples. O Excel apareceu e precisou suportar valores em arquivos de texto em que cada coluna foi separada por uma vírgula, então eles criaram .CSV
como uma extensão de arquivo que puderam registrar - e ficou preso (pode ter havido um precedente histórico de usar .CSV
. Eu não estou ciente de nenhum).
Engraçado, arquivos de "valores separados por abas" nunca foram muito comuns em DOS ou Windows, por quê? meu palpite: era muito difícil para muitos usuários do DOS entenderem ou trabalharem com guias. Era um caractere de controle herdado do conjunto de controle ASCII destinado a teletipos; formalmente não era um personagem imprimível. O gerador de caracteres de PC da IBM tinha um gráfico para isso, mas para obtê-lo você tinha que gravar diretamente na placa de vídeo para que ninguém realmente o usasse. Seu significado exato não foi padronizado. Se você renderizar o arquivo na tela ou imprimi-lo, os usuários não poderão "ver" ou distingui-lo dos espaços planejados. Muitos / a maioria dos editores não conseguiram inseri-lo.
Então, ninguém mordeu a isca. Ninguém pegou "arquivos com valores separados por tabulações" e criou uma extensão de arquivo que se tornou "padrão", em virtude de domínio personalizado ou de mercado.
.TXT
é provavelmente a extensão de arquivo mais comum. .TSV
é uma ótima opção se você precisar de algo diferente de .TXT
. Eu também vi e usei .TAB
de vez em quando.
Tags file-format