Problemas de localidade do Pandoc

1

Estou tentando gerar o arquivo pdf da documentação com o markdown2pdf do pandoc. Meu arquivo de origem contém alguns símbolos UTF-8 cirílicos. Minha localidade do sistema é en_US.UTF-8.

Quando executado na localidade padrão, o markdown2pdf não consegue carregar o documento:

$ markdown2pdf doc.md -o doc.pdf

markdown2pdf: /tmp/pandoc/doc.log: hGetContents: invalid argument (Invalid or incomplete multibyte or wide character)

Se eu definir LANG = ru_RU.UTF-8, markdown2pdf carrega bem o documento, lança as quebras de pandoc e pandoc (note um texto de erro diferente):

$ LANG=ru_RU.UTF-8 markdown2pdf doc.md -o doc.pdf
markdown2pdf: pandoc: doc.md: hGetContents: invalid argument (Invalid or incomplete multibyte or wide character)

Eu não quero alterar a localidade do meu sistema. Como posso resolver este problema?

Informação do sistema:

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 10.04.1 LTS
Release:    10.04
Codename:   lucid

$ uname -a
Linux localhost 2.6.32-24-generic #38-Ubuntu SMP Mon Jul 5 09:20:59 UTC 2010 x86_64 GNU/Linux

$ pandoc --version
pandoc 1.5.1.1
    
por Alexander Gladysh 24.07.2010 / 20:41

1 resposta

1

Eu tive que atualizar manualmente para o pandoc 1.6, que corrige esse bug:

  # Install and update cabal (Haskell's package manager)
  sudo apt-get install cabal
  cabal update
  cabal install cabal-install
  # Put cabal's executables to path
  echo "PATH=${PATH}:${HOME}/.cabal/bin" >> ${HOME}/.bashrc
  source ${HOME}/.bashrc
  # Reset bash's path cache
  hash -r

  cabal install -fhighlighting pandoc
    
por 28.08.2010 / 20:42