Parece estar relacionado ao Open Office Versão 2.6.3, com o Open Office 3.3.0 não temos mais problemas.
Quando tento converter um documento do word usando o script python ooextract de um escritório aberto, como
/usr/local/bin/ooextract.py myDocument.doc myDocument.pdf
o deamon de escritório aberto (sOffice.bin) leva 100% da carga da CPU para sempre.
Estamos usando o Open Office 2.6.3 em uma máquina virtual executando o debian squeeze 2.6.32-5-amd64
ATUALIZAÇÃO:
Descobrimos que isso aparece apenas com o nosso documento de teste, outros documentos podem ser convertidos sem problemas. Mas como podemos descobrir o que há de errado com nosso documento? Como podemos habilitar traços / loggin o processo sOffice.bin?
Eu tive um problema semelhante. Para depurá-lo, coloquei o documento de teste sob controle de versão e removi pedaços significativos dele de cada vez; garantindo que tomei nota de quais estruturas foram removidas.
Isso me permite isolá-lo para um problema com o 2.4.1 e uma tabela, contendo uma linha, com muito conteúdo de texto. A tabela foi permitida para dividir as páginas, a linha não foi. A renderização para PDF causou um problema semelhante de uso de CPU de 100%.