Existe uma maneira de remover arquivos de uma pasta que está em outra pasta?

21

Digamos que eu copie e cole arquivos da pasta A, que inclui:

Pasta A:

file1.cfg  
file2.txt  
file3.esp  
file4.bsa  

na pasta B, que depois de atualizar, tem:

Pasta B:

apples.mp3  
file1.cfg    *
file2.txt    *
file3.esp    *
file4.bsa    *
turtles.jpg

Existe uma maneira de excluir todos os arquivos da pasta A que estão na pasta B (marcada com um *)? Além de selecionar manualmente cada um e excluí-lo, ou ctrl-Z'ing logo após o copiar-colar

Eu preferiria um método windows ou algum software que pudesse fazer isso

obrigado!

    
por DarkFire13 26.06.2016 / 19:13

8 respostas

34

Existe um software gratuito chamado WinMerge . Você pode usar este software para combinar duplicatas. Primeiro, use FileOpen e escolha ambos os diretórios, com a pasta com os arquivos que você deseja manter à esquerda e os que você não deseja à direita. Em seguida, vá para View e desmarque Show Different Items , Show Left Unique Items e Show Right Unique Items . Isso deixará apenas os arquivos idênticos deixados na lista. Depois disso, escolha EditSelect All , clique com o botão direito do mouse em qualquer arquivo e clique em DeleteRight . Isso excluirá as duplicatas da pasta à direita.

    
por 27.06.2016 / 01:22
25

Isso pode ser feito através da linha de comando, usando o comando forfiles

Vamos supor que você tenha a pasta A localizada em c:\temp\Folder A e a pasta B em c:\temp\Folder B

O comando seria então:

c:\>forfiles /p "c:\temp\Folder A" /c "cmd /c del c:\temp\Folder B\@file"

Depois que isso for feito, a Pasta B terá todos os arquivos removidos presentes na Pasta A. Lembre-se de que, se a pasta B tiver arquivos com o mesmo nome, mas não o mesmo conteúdo, eles ainda serão excluídos. / p>

É possível estender isso para trabalhar com pastas em subpastas também, mas por medo de que isso se torne desnecessariamente complicado, decidi não postá-lo. Isso exigiria as opções / s e @relpath (e testes adicionais xD)

    
por 26.06.2016 / 20:18
11

Você pode usar este script do PowerShell:

$folderA = 'C:\Users\Ben\test\a\' # Folder to remove cross-folder duplicates from
$folderB = 'C:\Users\Ben\test\b\' # Folder to keep the last remaining copies in
Get-ChildItem $folderB | ForEach-Object {
    $pathInA = $folderA + $_.Name
    If (Test-Path $pathInA) {Remove-Item $pathInA}
}

Espero que seja bastante autoexplicativo. Ele verifica cada item na Pasta B, verifica se há um item com o mesmo nome na Pasta A e, em caso afirmativo, remove o item Pasta A. Observe que o% final \ nos caminhos das pastas é importante.

Versão de uma linha:

gci 'C:\Users\Ben\test\b\' | % {del ('C:\Users\Ben\test\a\' + $_.Name) -EA 'SilentlyContinue'}

Se você não se importa se recebe um grande número de erros vermelhos no console, pode remover o -EA 'SilentlyContinue' .

Salvar como um arquivo .ps1 , por exemplo %código%. Antes de poder executar scripts do PowerShell, você precisará ativar a execução deles:

Set-ExecutionPolicy Unrestricted -Scope CurrentUser

Então você poderá invocá-lo com dedupe.ps1 quando estiver na pasta que o contém.

    
por 27.06.2016 / 00:04
4

A resposta do LPChip é a melhor.

Mas como comecei a aprender Python, pensei: "Por que não escrever um script Python como resposta a essa pergunta?"

Instalar o Python e o Send2Trash

Você precisaria instalar o Python antes de poder executar o script a partir da linha de comando.

Em seguida, instale Send2Trash para que os arquivos excluídos não fiquem irremediavelmente, mas acabem na lixeira do sistema operacional:

pip install Send2Trash

Criar script

Crie um novo arquivo com, por exemplo, o nome DeleteDuplicateInFolderA.py

Copie o seguinte script no arquivo.

#!/usr/bin/python

import sys
import os
from send2trash import send2trash


class DeleteDuplicateInFolderA(object):
    """Given two paths A and B, the application determines which files are in
       path A which are also in path B and then deletes the duplicates from
       path A.

       If the "dry run" flag is set to 'true', files are deleted. Otherwise
       they are only displayed but not deleted.
    """

    def __init__(self, path_A, path_B, is_dry_run=True):
        self._path_A = path_A
        self._path_B = path_B
        self._is_dry_run = is_dry_run

    def get_filenames_in_folder(self, folder_path):
        only_files = []
        for (dirpath, dirnames, filenames) in os.walk(folder_path):
            only_files.extend(filenames)
        return only_files

    def print_files(sel, heading, files):
        print(heading)
        if len(files) == 0:
            print("   none")
        else:
            for file in files:
                print("   {}".format(file))

    def delete_duplicates_in_folder_A(self):
        only_files_A = self.get_filenames_in_folder(self._path_A)
        only_files_B = self.get_filenames_in_folder(self._path_B)

        files_of_A_that_are_in_B = [file for file in only_files_A if file in only_files_B]

        self.print_files("Files in {}".format(self._path_A), only_files_A)
        self.print_files("Files in {}".format(self._path_B), only_files_B)

        if self._is_dry_run:
            self.print_files("These files would be deleted: ", [os.path.join(self._path_A, file) for file in files_of_A_that_are_in_B])
        else:
            print("Deleting files:")
            for filepath in [os.path.join(self._path_A, file) for file in files_of_A_that_are_in_B]:
                print("   {}".format(filepath))
                # os.remove(filepath)  # Use this line instead of the next if Send2Trash is not installed
                send2trash(filepath)

if __name__ == "__main__":
    if len(sys.argv) == 4:
        is_dry_run_argument = sys.argv[3]
        if not is_dry_run_argument == "--dryrun":
            println("The 3rd argument must be '--dryrun' or nothing.")
        else:
            app = DeleteDuplicateInFolderA(sys.argv[1], sys.argv[2], is_dry_run=True)
    else:
        app = DeleteDuplicateInFolderA(sys.argv[1], sys.argv[2], is_dry_run=False)
    app.delete_duplicates_in_folder_A()

Uso

Modo de execução a seco, que mostra quais arquivos seriam excluídos sem realmente excluir nenhum arquivo:

c:\temp> python .\DeleteDuplicateInFolderA.py c:\temp\test\A c:\temp\test\B --dryrun

Modo de exclusão de arquivos, que de fato exclui arquivos, por isso tome cuidado:

c:\temp> python .\DeleteDuplicateInFolderA.py c:\temp\test\A c:\temp\test\B

Saída do modo de funcionamento a seco

Files in C:\temp\A
  1.txt
  2.txt
Files in C:\temp\B
  2.txt
  3.txt
These files would be deleted:
  C:\temp\A.txt

Saída do modo de exclusão de arquivos

Files in C:\temp\A
  1.txt
  2.txt
Files in C:\temp\B
  2.txt
  3.txt
Deleting files:
  C:\temp\A.txt

Teste de unidade

Se você quiser testar o aplicativo acima, crie um arquivo chamado DeleteDuplicateInFolderATest.py e cole esses testes unitários:

import unittest
import os
import shutil
from DeleteDuplicateInFolderA import DeleteDuplicateInFolderA


class DeleteDuplicateInFolderATest(unittest.TestCase):

    def __init__(self, *args, **kwargs):
        super(DeleteDuplicateInFolderATest, self).__init__(*args, **kwargs)
        self._base_directory = r"c:\temp\test"
        self._path_A = self._base_directory + r"\A"
        self._path_B = self._base_directory + r"\B"

    def create_folder_and_create_some_files(self, path, filename_list):
        if os.path.exists(path):
            shutil.rmtree(path)
        os.makedirs(path)
        for filename in filename_list:
            open(os.path.join(path, filename), "w+").close()

    def setUp(self):
        # Create folders and files for testing
        self.create_folder_and_create_some_files(self._path_A, ["1.txt", "2.txt"])
        self.create_folder_and_create_some_files(self._path_B, ["2.txt", "3.txt"])

    def tearDown(self):
        for path in [self._path_A, self._path_B, self._base_directory]:
            if os.path.exists(path):
                shutil.rmtree(path)

    def test_duplicate_file_gets_deleted(self):
        # Arrange
        app = DeleteDuplicateInFolderA(self._path_A, self._path_B, is_dry_run=False)

        # Act
        app.delete_duplicates_in_folder_A()

        # Assert
        self.assertFalse(os.path.isfile(self._path_A + r".txt"), "File 2.txt has not been deleted.")

    def test_duplicate_file_gets_not_deleted_in_mode_dryrun(self):
        # Arrange
        app = DeleteDuplicateInFolderA(self._path_A, self._path_B, is_dry_run=True)

        # Act
        app.delete_duplicates_in_folder_A()

        # Assert
        self.assertTrue(os.path.isfile(self._path_A + r".txt"), "File 2.txt should not have been deleted in mode '--dryrun'")

def main():
    unittest.main()

if __name__ == '__main__':
    main()
    
por 26.06.2016 / 20:56
4

rsync

rsync é um programa usado para sincronizar o diretório. Das muitas (muitas) opções que você tem, há a auto-explicação --ignore-non-existing , --remove-source-files e --recursive .

Você pode fazer

rsync -avr --ignore-non-existing --recursive --remove-source-files   B/ A -v

se nós supusermos que você tenha os arquivos no diretório A (4) e B (4 + 2).

A       B
├── a   ├── a
├── b   ├── b
├── c   ├── c
└── d   ├── d
        ├── e
        └── f     # Before


A       B
├── a   ├── e
├── b   └── f
├── c   
└── d             # After
    
por 27.06.2016 / 14:17
1

Usando o bash

for f in $(ls /path/to/folderB/); do 
    rm -rf /path/to/folderA/$f
done

Claro que você poderia ser mais seguro verificando se o arquivo está lá ou verificando se o nome do arquivo é seguro. Mas supondo que você só quer fazer isso, e não tem arquivos com nomes ridículos em folderB - esta é uma maneira rápida e suja de fazê-lo. (e você pode usar o emulador de bash que vem com git , se você não estiver executando o Win10 + bash)

    
por 27.06.2016 / 19:22
1

Let's say I copy and paste files from folder A into folder B.

Is there a way to delete all files from folder A that are in folder B? Besides manually selecting each one and deleting it, or ctrl-Z'ing right after the copy-paste

Método do Windows

Se você sempre precisar copiar arquivos de um local para outro e depois garantir que os arquivos que foram copiados com êxito também sejam excluídos do local de origem original, abaixo é uma solução de script em lotes que pode ser usada para automatizar toda a tarefa. com apenas um simples clique em cada execução.

  • Certifique-se de definir as variáveis SourceDir e DestDir de acordo com suas necessidades.

  • Além disso, na parte do script abaixo como ("%SourceDir%\*.*") DO , você pode simplesmente alterar o valor *.* para ser mais explícito para nomes de arquivos ( File A.txt ) ou extensões de arquivo ( *.wav ) conforme necessário .

@ECHO ON
SET SourceDir=C:\Users\User\Desktop\Source
SET DestDir=C:\Users\User\Desktop\Dest

FOR %%A IN ("%SourceDir%\*.*") DO XCOPY /F /Y "%%~A" "%DestDir%\" && DEL /Q /F "%%~A"
GOTO EOF

Mais recursos

por 27.06.2016 / 03:35
0

Qualquer programa no estilo NC, como o Total Commander, possui um comando de diferença de diretório que seleciona arquivos em ambas as guias que são diferentes da outra guia. Chame este comando, tab para o diretório maior (B), inverta a seleção usando * e delete. Isso tem a vantagem de não excluir arquivos que podem ter sido alterados (de alguma forma) e não são os mesmos, embora concordem em nome. Você pode usar o mesmo comando diff do diretório para localizá-los após a exclusão.

Eu acho que estou preso nos anos noventa ... mas eu realmente não vi nada mais elegante desde :-) Até agora esta é a única resposta que requer apenas uns 5 pressionamentos de tecla e nenhuma linha de script / comando qualquer que seja.

    
por 28.06.2016 / 00:04