Eu posso chegar perto do que quero com o seguinte:
from unicodedata import name
for i in range(0x10ffff):
print unichr(i), name(unichr(i))
e salvando a saída, mas eu esperava que alguém já tivesse compilado e mantido algo.
Eu quero algo como o gucharmap que funciona em um terminal e me deixa pesquisar. Uma manpage com todos os nomes de caracteres unicode seria suficiente, assim como uma aplicação ncurses.
Não encontrei nada em 5 minutos de pesquisa no Google, por isso estou a perguntar aqui.
Talvez seja isso que você precisa:
curl http://www.unicode.org/charts/charindex.html | grep "Small Letters, Cyrillic"
É imperfeito, e um pouco lento, e a saída pode ser limpa um pouco, mas você obterá o código do caractere para o que está procurando. Você pode salvar a página e limpá-la com um pouco de sed / awk love para obter um arquivo com apenas nomes e códigos.