Verifica arquivos duplicados com diferentes extensões


Estou procurando nomes de arquivos duplicados com extensões de arquivo diferentes.

Aqui está o comando que eu executo:

find -maxdepth 2 -type f \( -name "*.avi" -or -name "*.mkv" -or -name "*.mp4" -or -name "*.mpg" -or -name "*.MP4" -not -name '*~' \) | sort > ~/sorted.txt

Aqui está um exemplo de saída (em sorted.txt ):

./Avengers- Age of Ultron (2015)/Avengers- Age of Ultron (2015).mp4
./Beetle Juice (1988)/Beetle Juice (1988).avi
./Clerks II (2006)/Clerks II (2006).avi
./Death Race (2008)/Death Race (2008)-pt1.avi
./Death Race (2008)/Death Race (2008)-pt2.avi
./Death Race 2 (2010)/Death Race 2 (2010).mp4
./Into the Wild (2007)/Into the Wild (2007).avi
./Into the Woods (2014)/Into the Woods (2014).mkv
./Into the Woods (2014)/Into the Woods (2014).mp4
./Pink Floyd  The Wall (1982)/Pink Floyd  The Wall (1982).avi
./The Big Lebowski (1998)/The Big Lebowski (1998).avi
./The Gods Must Be Crazy (1980)/The Gods Must Be Crazy (1980).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).mpg
./Winnie the Pooh (2002)/Winnie the Pooh (2002).avi

Eu quero cortar a saída gravada em sorted.txt para isso:

./Into the Woods (2014)/Into the Woods (2014).mkv
./Into the Woods (2014)/Into the Woods (2014).mp4 
./The NeverEnding Story (1984)/The NeverEnding Story (1984).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).mpg

, ou seja, os títulos dos quais tenho mais de uma cópia. Melhor ainda seria assim, mas o que foi dito acima será o seguinte:

Into the Woods (2014)
The NeverEnding Story (1984)

Nota: haverá espaços, traços ( - ), apóstrofos ( ' ) e parênteses ( ( e ) ) nos nomes de arquivos (mas sem vírgulas ( , ), aspas duplas ( " ), ou sublinhados ( _ ) em nomes de arquivos). Além disso, a saída final é para os olhos lerem, por isso não precisa ser bonita. Eu só preciso ser capaz de identificar manualmente as duplicatas rapidamente.

por jasenmichael 07.11.2015 / 06:04

1 resposta


Tente isto:

rev < sorted.txt | cut -d . -f 2- | cut -d / -f 1 | rev | uniq -d


Into the Woods (2014)
The NeverEnding Story (1984)
por 07.11.2015 / 09:51