Tente isto:
rev < sorted.txt | cut -d . -f 2- | cut -d / -f 1 | rev | uniq -d
Saída:
Into the Woods (2014) The NeverEnding Story (1984)
Estou procurando nomes de arquivos duplicados com extensões de arquivo diferentes.
Aqui está o comando que eu executo:
find -maxdepth 2 -type f \( -name "*.avi" -or -name "*.mkv" -or -name "*.mp4" -or -name "*.mpg" -or -name "*.MP4" -not -name '*~' \) | sort > ~/sorted.txt
Aqui está um exemplo de saída (em sorted.txt
):
./Avengers- Age of Ultron (2015)/Avengers- Age of Ultron (2015).mp4
./Beetle Juice (1988)/Beetle Juice (1988).avi
./Clerks II (2006)/Clerks II (2006).avi
./Death Race (2008)/Death Race (2008)-pt1.avi
./Death Race (2008)/Death Race (2008)-pt2.avi
./Death Race 2 (2010)/Death Race 2 (2010).mp4
./Into the Wild (2007)/Into the Wild (2007).avi
./Into the Woods (2014)/Into the Woods (2014).mkv
./Into the Woods (2014)/Into the Woods (2014).mp4
./Pink Floyd The Wall (1982)/Pink Floyd The Wall (1982).avi
./The Big Lebowski (1998)/The Big Lebowski (1998).avi
./The Gods Must Be Crazy (1980)/The Gods Must Be Crazy (1980).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).mpg
./Winnie the Pooh (2002)/Winnie the Pooh (2002).avi
Eu quero cortar a saída gravada em sorted.txt
para isso:
./Into the Woods (2014)/Into the Woods (2014).mkv
./Into the Woods (2014)/Into the Woods (2014).mp4
./The NeverEnding Story (1984)/The NeverEnding Story (1984).avi
./The NeverEnding Story (1984)/The NeverEnding Story (1984).mpg
, ou seja, os títulos dos quais tenho mais de uma cópia. Melhor ainda seria assim, mas o que foi dito acima será o seguinte:
Into the Woods (2014)
The NeverEnding Story (1984)
Nota:
haverá espaços, traços ( -
), apóstrofos ( '
) e parênteses ( (
e )
) nos nomes de arquivos (mas sem vírgulas ( ,
), aspas duplas ( "
), ou sublinhados ( _
) em nomes de arquivos).
Além disso, a saída final é para os olhos lerem, por isso não precisa ser bonita.
Eu só preciso ser capaz de identificar manualmente as duplicatas rapidamente.
Tente isto:
rev < sorted.txt | cut -d . -f 2- | cut -d / -f 1 | rev | uniq -d
Saída:
Into the Woods (2014) The NeverEnding Story (1984)