Como posso extrair os dados de um arquivo .docx corrompido?

1

O arquivo .docx da minha namorada está corrompido e estou tentando recuperar o texto dele. Eu aprendi que. Docx é essencialmente um arquivo zip que contém pastas e um monte de arquivos. XML (e um deles contém texto do documento). Eu seguindo o comando no Ubuntu 10.10 para descompactar o arquivo:

unzip portfolio.docx -d file-dir

O resultado que obtive é:

End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.

No Windows 8.1, tentei o WinZip, o 7zip, o WinRar e o Zip2Fix, mas sem sorte.

O arquivo pesa quase 20Kb, então sei que há algum conteúdo dentro dele. Existe alguma maneira de forçar a descompactação ?

    
por Matthew C 09.12.2013 / 21:51

1 resposta

3

Execute isto:

cp portfolio.docx portfolio.zip

Ou apenas renomeie portfolio.docx para portfolio.zip e você poderá abrir o arquivo portfolio.zip resultante com o Gerenciador de arquivos e extraí-los.

Editar: só fiz uma verificação rápida, os arquivos provavelmente estarão em word/document.xml ou docProps/core.xml na pasta extraída.

Outra edição: Se o arquivo zip resultante estiver corrompido, procure aqui .

    
por Wilf 09.12.2013 / 22:02