Como procurar e remover (ou recuperar) documentos corrompidos do Word em uma pasta?

0

Eu tenho um disco rígido antigo que eu não consegui recuperar arquivos usando o TestDisk, então usei PhotoRec para escaneie o disco rígido para recuperar todos os arquivos que eu puder.

Acabei com muitos documentos do Word (arquivos .doc) que parecem estar corrompidos. Quando eu abri-los, eu recebo a seguinte janela:

Existe alguma maneira de digitalizar o diretório de documentos do Word para que eu acabe com apenas os documentos do Word válidos (não corrompidos)? Isso evitará que eu abra e verifique cada documento individualmente.

ATUALIZAÇÃO:

Os primeiros 32 bytes de dados em cada um desses arquivos .doc foram os mesmos ...

D0 CF 11 E0 A1 B1 1A E1 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 3E 00 03 00 FE FF 09 00

A assinatura do arquivo, D0 CF 11 E0 A1 B1 1A E1 , informa que são documentos do Microsoft Office. Eu tentei abrir um dos arquivos com as seguintes extensões: DOC, DOT, PPS, PPT, XLA, XLS, WIZ. Em todos os casos, um erro foi produzido.

    
por cornflakes24 17.09.2014 / 00:17

1 resposta

0

Você pode usar Anti-palavras para tentar ler DOC arquivos. Você pode obter a versão para Windows aqui .

Descompacte o Antiword em C:\antiword\ e navegue para essa pasta usando o prompt de comando.
Você pode então usar o comando:

antiword PATH_TO_DOC_FILES\*.doc > tmpfile.txt

O Antiword gerará o conteúdo em texto puro dos arquivos DOC que ele foi capaz de ler para tmpfile.txt e você poderá classificar os arquivos necessários e excluir os arquivos corrompidos.

A saída do Antiword pode ser algo assim:

::::::::::::::
Document 1.doc
::::::::::::::
                                Sample Document 1

This is a sample Word document.

::::::::::::::
Document 2.doc
::::::::::::::
                                Sample Document 2

This is another sample Word document.

::::::::::::::
Corrupt Document.doc
::::::::::::::

::::::::::::::
Another Corrupt Document.doc
::::::::::::::

Você poderia então usar grep ou fazer uma correspondência de expressão regular para encontrar os nomes dos documentos corrompidos e excluí-los.

    
por 18.09.2014 / 19:40