Tentando renomear uma grande quantidade de arquivos .doc baseados na primeira linha ou mais de texto

2

Eu estava tentando ajudar um amigo que recuperou um monte de dados, mas os metadados foram perdidos. Como a maioria é artigos ou receitas, ela acredita que o título ou a primeira linha de texto serão bons o suficiente para um nome de arquivo.

Eu queria tentar usar um script powershell para ... acessar / ler os arquivos, pegar a primeira linha (se possível definir um comprimento de caracteres) e depois renomear. Como ... leia os 10 primeiros caracteres e renomeie o arquivo.

Eu encontrei este script, que parece ser para arquivos .txt. É possível retrabalhar isso para .doc e então eliminar a parte sobre O e apenas ler o que quer que seja a primeira linha e renomear com os 10 primeiros caracteres lidos?

Qualquer ajuda seria muito apreciada. (desculpas se eu estraguei a postagem do script)

$myFolderFullOfTextFiles = 'C:\recoveredDocs'
$linesToReadInEachTextFile = 5

$myTextFiles = Get-ChildItem -Path $myFolderFullOfTextFiles

foreach( $textFile in $myTextFiles )
{
$newName = ''

foreach( $line in $(Get-Content -Path $textFile.FullName -Head $linesToReadInEachTextFile) )
{
    if( $line -like 'O*' )
    {
       $newName = $textFile.DirectoryName + '\' + $line.Substring(0,6) + '.txt'
    }
}

try
{
    Write-Host $newName
    Rename-Item -Path $textFile.FullName -NewName $newName
}
catch
{
    Write-Host "Failed to rename $textFile."
}

}

Eu também encontrei este script. que é mais focado .doc. Tudo que eu preciso é ... ler qualquer que seja a primeira linha de texto, renomeie-a (com algum limite razoável nos caracteres, como os 10 primeiros caracteres).

Set objWord = CreateObject("Word.Application")
objWord.Visible = True

Set objDoc = objWord.Documents.Open("C:\Scripts\Test.doc")

strText = objDoc.Paragraphs(1).Range.Text
arrText = Split(strText, vbTab)
intIndex = Ubound(arrText)
strUserName = arrText(intIndex)

arrUserName = Split(strUserName, " ")
intLength = Len(arrUserName(1))
strName = Left(arrUserName(1), intlength - 1)

strUserName = strName & ", " & arrUserName(0)

strText = objDoc.Paragraphs(2).Range.Text
arrText = Split(strText, vbTab)
intIndex = Ubound(arrText)

strDate = arrText(intIndex)
strDate = Replace(strDate, "/", "")

intLength = Len(strDate)
strDate = Left(strDate, intlength - 1)

strFileName = "C:\Scripts\" &  strUserName & " " & strDate & ".doc"

objWord.Quit

Wscript.Sleep 5000

Set objFSO = CreateObject("Scripting.FileSystemObject")
objFSO.MoveFile "C:\Scripts\Test.doc", strFileName
    
por stephen 21.05.2015 / 02:06

1 resposta

0

Copie o seguinte código e crie como script powershell nomeando o arquivo com a extensão .ps1 (testado ok com o powershell 4 no Windows 7 - verifique sua versão do powershell com "get-host | Select-Object version" ou "$ PSVersionTable. PSVersion ")

 $word_app = New-Object -ComObject Word.Application     <# New word application #>
    $source = 'C:\recoveredDocs'    <# create the source variable #>
    $destination = 'C:\renamedDocs' <# create the destination variable #>

    if (!(Test-Path -path $destination)) {  <# check to see if destination folder exists #>
    New-Item -path $destination\ -type directory -Force  } <# create destination folder if it doesn't already exist #>
    echo 'checking files to convert...'

    <# filter for word .doc files only #>
    Get-ChildItem -Path $source -Filter *.doc? | ForEach-Object {
    if (!(Test-Path "$destination\$($_.BaseName).doc")) {   <# check to see if file is already in destination folder (Note. "!" is a PS Alias for "-Not") #>

    $document = $word_app.Documents.Open($_.FullName)   <# open word document #>

    $pattern = '[^a-zA-Z1234567890 ]'   <# create regex pattern of allowed characters #>

    $textstring = $document.range().text <# get the text string from the document #>

    $titlestring = $textstring -replace $pattern, ''    <# apply the regex pattern to eliminate the reserved characters #>

    $title = $titlestring.substring(0, [System.Math]::Min(10, $titlestring.Length)) <# limit the string to 10 characters #>

    $doc_strNewName = "$destination\$($title).doc"  <# create the new name and path for the doc #>

    echo "$($_.FullName) converted to  $doc_strNewName"

$document.SaveAs([ref] $doc_strNewName, [ref] 0)    <# save the document with new name and path #>

$document.Close()   <# close documnet #>

        }
    }

    echo "No More Files to Convert"

$word_app.Quit()    <# close the word application #>
    
por 03.05.2016 / 18:23