Qual é a codificação de caracteres padrão?

8

Eu mesmo não sei o quão profunda essa questão realmente vai (por exemplo, tudo que eu sei que pode haver vários, dependendo da minha tarefa).

Particularmente, estou interessado em quais tipos de strings são usados para nomear arquivos e pastas no sistema.

Também estou interessado em saber como as strings são representadas por padrão para um script bash ou python.

    
por gabkdlly 28.08.2010 / 19:22

2 respostas

3
  • A codificação de nomes de arquivos no sistema de arquivos é utf-8.
  • Bash pensa em bytes, não em strings-with-encoding-knowledge. Portanto, não há codificação padrão. A codificação padrão do gnome-terminal é utf-8
  • A codificação padrão do Python é ascii
por Dennis Kaarsemaker 29.08.2010 / 16:02
7

A codificação de caracteres padrão é UTF-8 (Unicode), embora quase todos (muito possivelmente todos em uma instalação padrão) nomes sejam caracteres ASCII comuns, comuns à maioria das codificações.

Eu não sei o que você quer dizer com "quantas strings são representadas por um script bash ou python". Você pode usar caracteres Unicode em scripts bash no Ubuntu, mas geralmente com um script bash, você chama outros programas, e se esses outros programas irão lidar com eles é outra questão. É certamente possível fazê-lo também com o Python, embora você queira se familiarizar com os pacotes e configurações relacionados a ele.

    
por frabjous 28.08.2010 / 19:46