A codificação de caracteres padrão é UTF-8 (Unicode), embora quase todos (muito possivelmente todos em uma instalação padrão) nomes sejam caracteres ASCII comuns, comuns à maioria das codificações.
Eu não sei o que você quer dizer com "quantas strings são representadas por um script bash ou python". Você pode usar caracteres Unicode em scripts bash no Ubuntu, mas geralmente com um script bash, você chama outros programas, e se esses outros programas irão lidar com eles é outra questão. É certamente possível fazê-lo também com o Python, embora você queira se familiarizar com os pacotes e configurações relacionados a ele.