Um método de representar caracteres (como A, 9,%, ழ, ♦ e caracteres de controle não imprimíveis) para armazenamento e comunicação. O padrão Unicode fornece um ponto de código (número) para cada um dos mais de 100.000 caracteres diferentes, e o padrão é implementado por codificações de caracteres como UTF-8, amplamente usado em sistemas Linux. Os primeiros 128 pontos de código Unicode são os caracteres ASCII, que UTF-8 representa com 1 byte por caractere.
Normalmente eu uso o GNU wget para pegar sites de forma recursiva.
Mas eu quero buscar alguns sites com muitos URLs Unicode para vários idiomas e gostaria de manter o Unicode nos nomes dos arquivos. ( Aqui está um exemplo. )
wget tem a l...
21.03.2016 / 09:41
Ao emitir git mergetool após git pull origin master DiffMerge , que é configurado como uma ferramenta de mesclagem, reclama que o arquivo _BASE não pode ser aberto com a codificação UTF-8. file -I [path to _BASE file] mostra que a...
15.12.2015 / 13:48
O DTS Core é de 1,5 mbps, o AC-3 é de 640 kbps, mas ouvi dizer que o AC-3 é muito mais eficiente do que o DTS e que o DTS a 1,5 mbps é igual ao AC-3 do 640.
No entanto, se a origem for DTS-HD MA, a extração do núcleo do DTS copiaria apenas parte...
09.12.2015 / 21:00
Eu tenho um grande número de arquivos que (devido a alguns transportes em vários estágios) possuem nomes de arquivos incorretos. Por exemplo, um arquivo que deve ser nomeado
Τεχνικός Di 04.02.2014 23_43.msg
é atualmente nomeado
+ñ...
09.12.2015 / 12:25
Eu tenho um PDF convertido / exportado do Pages.app. Quando copio texto (inglês) do PDF e colo em email / editor de texto / ou Illustrator etc., o texto parece ser rabisco (quadrados com símbolos cruzados e aleatórios, etc.) Não consigo entender...
30.08.2015 / 01:51
Eu tenho um arquivo UTF-16 com uma lista de materiais. Eu configurei fileencodings para:
set fencs=ucs-bom,utf-16le,utf-8,default,latin1
No entanto, devido a um caractere em uma linha, o vim não detecta automaticamente o UTF-16 e o pa...
01.06.2015 / 11:00
Eu desenvolvi um aplicativo usando o framework web Bottle e o Python, para importar alguns dados para o banco de dados MySQL. A maioria dos dados em caracteres gregos. No lado da minha aplicação, eu não fiz mais nenhuma codificação / decodificaç...
17.05.2015 / 00:24
Meu laptop tem sistemas de inicialização dupla, um é o win7, outro é o Arch linux, eles compartilham um disco. E eu baixei alguns arquivos para o disco compartilhado no Arch Linux, cujos nomes de arquivos contêm caracteres chineses, coreanos e j...
23.12.2014 / 13:07
Estou tentando restaurar a pasta de uploads de uma instalação do wordpress. A pasta passou por alguma combinação de transferência ftp ou sftp e foi compactada por rar. (Eu não sei o processo exato, não foi feito por mim). Agora eles estão ilegív...
21.12.2014 / 22:46
O Emacs é exibido em um arquivo de texto:
Given a finite alphabet 62, (empty set) 1621 denoting the set 1621.
Mas isso deve mostrar
Given a finite alphabet Σ, (empty set) ∅ denoting the set ∅.
O que devo fazer para que o Emacs mo...
27.07.2014 / 17:46