Perguntas sobre encoding. Página # 33

Um método de representar caracteres (como A, 9,%, ழ, ♦ e caracteres de controle não imprimíveis) para armazenamento e comunicação. O padrão Unicode fornece um ponto de código (número) para cada um dos mais de 100.000 caracteres diferentes, e o padrão é implementado por codificações de caracteres como UTF-8, amplamente usado em sistemas Linux. Os primeiros 128 pontos de código Unicode são os caracteres ASCII, que UTF-8 representa com 1 byte por caractere.

respostas

Baixar recursivamente o site no Windows preservando nomes de arquivos Unicode

Normalmente eu uso o GNU wget para pegar sites de forma recursiva. Mas eu quero buscar alguns sites com muitos URLs Unicode para vários idiomas e gostaria de manter o Unicode nos nomes dos arquivos. ( Aqui está um exemplo. ) wget tem a l...

21.03.2016 / 08:41

respostas

Por que o git cria arquivos _BASE codificados por iso-8859-1 para o mergetool se os arquivos locais e remotos são codificados utf-8?

Ao emitir git mergetool após git pull origin master DiffMerge , que é configurado como uma ferramenta de mesclagem, reclama que o arquivo _BASE não pode ser aberto com a codificação UTF-8. file -I [path to _BASE file] mostra que a...

15.12.2015 / 12:48

respostas

A conversão de DTS-HD MA para AC3 leva a uma qualidade inferior ao extrair o núcleo do DTS?

O DTS Core é de 1,5 mbps, o AC-3 é de 640 kbps, mas ouvi dizer que o AC-3 é muito mais eficiente do que o DTS e que o DTS a 1,5 mbps é igual ao AC-3 do 640. No entanto, se a origem for DTS-HD MA, a extração do núcleo do DTS copiaria apenas parte...

09.12.2015 / 20:00

respostas

Bloquear renomear arquivos com nomes de arquivos codificados incorretamente no Windows

Eu tenho um grande número de arquivos que (devido a alguns transportes em vários estágios) possuem nomes de arquivos incorretos. Por exemplo, um arquivo que deve ser nomeado Τεχνικός Di 04.02.2014 23_43.msg é atualmente nomeado +ñ...

09.12.2015 / 11:25

respostas

Texto gibi copiado do PDF

Eu tenho um PDF convertido / exportado do Pages.app. Quando copio texto (inglês) do PDF e colo em email / editor de texto / ou Illustrator etc., o texto parece ser rabisco (quadrados com símbolos cruzados e aleatórios, etc.) Não consigo entender...

29.08.2015 / 23:51

resposta

Obtenha o vim para ignorar erros de conversão ao ler o arquivo

Eu tenho um arquivo UTF-16 com uma lista de materiais. Eu configurei fileencodings para: set fencs=ucs-bom,utf-16le,utf-8,default,latin1 No entanto, devido a um caractere em uma linha, o vim não detecta automaticamente o UTF-16 e o pa...

01.06.2015 / 09:00

respostas

MySQL csv excel caracteres gregos

Eu desenvolvi um aplicativo usando o framework web Bottle e o Python, para importar alguns dados para o banco de dados MySQL. A maioria dos dados em caracteres gregos. No lado da minha aplicação, eu não fiz mais nenhuma codificação / decodificaç...

16.05.2015 / 22:24

respostas

codificação de nome de arquivo para windows e linux

Meu laptop tem sistemas de inicialização dupla, um é o win7, outro é o Arch linux, eles compartilham um disco. E eu baixei alguns arquivos para o disco compartilhado no Arch Linux, cujos nomes de arquivos contêm caracteres chineses, coreanos e j...

23.12.2014 / 12:07

respostas

Nomes de arquivos truncados em arquivo rar, possivelmente duplo codificado em utf8? Não consigo descobrir como reverter

Estou tentando restaurar a pasta de uploads de uma instalação do wordpress. A pasta passou por alguma combinação de transferência ftp ou sftp e foi compactada por rar. (Eu não sei o processo exato, não foi feito por mim). Agora eles estão ilegív...

21.12.2014 / 21:46

respostas

Altera a codificação de um arquivo de texto no Emacs?

O Emacs é exibido em um arquivo de texto: Given a finite alphabet 62, (empty set) 1621 denoting the set 1621. Mas isso deve mostrar Given a finite alphabet Σ, (empty set) ∅ denoting the set ∅. O que devo fazer para que o Emacs mo...

27.07.2014 / 15:46

Perguntas sobre 'encoding'