Tentando renomear uma grande quantidade de arquivos .doc baseados na primeira linha ou mais de texto


Eu estava tentando ajudar um amigo que recuperou um monte de dados, mas os metadados foram perdidos. Como a maioria é artigos ou receitas, ela acredita que o título ou a primeira linha de texto serão bons o suficiente para um nome de arquivo.

Eu queria tentar usar um script powershell para ... acessar / ler os arquivos, pegar a primeira linha (se possível definir um comprimento de caracteres) e depois renomear. Como ... leia os 10 primeiros caracteres e renomeie o arquivo.

Eu encontrei este script, que parece ser para arquivos .txt. É possível retrabalhar isso para .doc e então eliminar a parte sobre O e apenas ler o que quer que seja a primeira linha e renomear com os 10 primeiros caracteres lidos?

Qualquer ajuda seria muito apreciada. (desculpas se eu estraguei a postagem do script)

$myFolderFullOfTextFiles = 'C:\recoveredDocs'
$linesToReadInEachTextFile = 5

$myTextFiles = Get-ChildItem -Path $myFolderFullOfTextFiles

foreach( $textFile in $myTextFiles )
$newName = ''

foreach( $line in $(Get-Content -Path $textFile.FullName -Head $linesToReadInEachTextFile) )
    if( $line -like 'O*' )
       $newName = $textFile.DirectoryName + '\' + $line.Substring(0,6) + '.txt'

    Write-Host $newName
    Rename-Item -Path $textFile.FullName -NewName $newName
    Write-Host "Failed to rename $textFile."


Eu também encontrei este script. que é mais focado .doc. Tudo que eu preciso é ... ler qualquer que seja a primeira linha de texto, renomeie-a (com algum limite razoável nos caracteres, como os 10 primeiros caracteres).

Set objWord = CreateObject("Word.Application")
objWord.Visible = True

Set objDoc = objWord.Documents.Open("C:\Scripts\Test.doc")

strText = objDoc.Paragraphs(1).Range.Text
arrText = Split(strText, vbTab)
intIndex = Ubound(arrText)
strUserName = arrText(intIndex)

arrUserName = Split(strUserName, " ")
intLength = Len(arrUserName(1))
strName = Left(arrUserName(1), intlength - 1)

strUserName = strName & ", " & arrUserName(0)

strText = objDoc.Paragraphs(2).Range.Text
arrText = Split(strText, vbTab)
intIndex = Ubound(arrText)

strDate = arrText(intIndex)
strDate = Replace(strDate, "/", "")

intLength = Len(strDate)
strDate = Left(strDate, intlength - 1)

strFileName = "C:\Scripts\" &  strUserName & " " & strDate & ".doc"


Wscript.Sleep 5000

Set objFSO = CreateObject("Scripting.FileSystemObject")
objFSO.MoveFile "C:\Scripts\Test.doc", strFileName
por stephen 21.05.2015 / 02:06

1 resposta


Copie o seguinte código e crie como script powershell nomeando o arquivo com a extensão .ps1 (testado ok com o powershell 4 no Windows 7 - verifique sua versão do powershell com "get-host | Select-Object version" ou "$ PSVersionTable. PSVersion ")

 $word_app = New-Object -ComObject Word.Application     <# New word application #>
    $source = 'C:\recoveredDocs'    <# create the source variable #>
    $destination = 'C:\renamedDocs' <# create the destination variable #>

    if (!(Test-Path -path $destination)) {  <# check to see if destination folder exists #>
    New-Item -path $destination\ -type directory -Force  } <# create destination folder if it doesn't already exist #>
    echo 'checking files to convert...'

    <# filter for word .doc files only #>
    Get-ChildItem -Path $source -Filter *.doc? | ForEach-Object {
    if (!(Test-Path "$destination\$($_.BaseName).doc")) {   <# check to see if file is already in destination folder (Note. "!" is a PS Alias for "-Not") #>

    $document = $word_app.Documents.Open($_.FullName)   <# open word document #>

    $pattern = '[^a-zA-Z1234567890 ]'   <# create regex pattern of allowed characters #>

    $textstring = $document.range().text <# get the text string from the document #>

    $titlestring = $textstring -replace $pattern, ''    <# apply the regex pattern to eliminate the reserved characters #>

    $title = $titlestring.substring(0, [System.Math]::Min(10, $titlestring.Length)) <# limit the string to 10 characters #>

    $doc_strNewName = "$destination\$($title).doc"  <# create the new name and path for the doc #>

    echo "$($_.FullName) converted to  $doc_strNewName"

$document.SaveAs([ref] $doc_strNewName, [ref] 0)    <# save the document with new name and path #>

$document.Close()   <# close documnet #>


    echo "No More Files to Convert"

$word_app.Quit()    <# close the word application #>
por 03.05.2016 / 18:23