Primeiro; Existe uma razão pela qual você precisa usar links simbólicos e não os links habituais? Eu estou tendo dificuldade em entender a necessidade de links simbólicos com caminhos relativos. Aqui está como eu resolveria esse problema:
Eu acho que a versão Debian (Ubuntu) dos fdupes pode substituir duplicatas com hard
links usando a opção -L
, mas eu não tenho uma instalação Debian para verificar
isso.
Se você não tem uma versão com a opção -L
, você pode usar este pequeno script bash que eu encontrei em commandlinefu .
Note que esta sintaxe só funcionará no bash.
fdupes -r -1 path | while read line; do master=""; for file in ${line[*]}; do if [ "x${master}" == "x" ]; then master=$file; else ln -f "${master}" "${file}"; fi; done; done
O comando acima irá encontrar todos os arquivos duplicados em "path" e substituí-los por
hardlinks. Você pode verificar isso executando ls -ilR
e observando o inode
número. Aqui está um samle com dez arquivos idênticos:
$ ls -ilR
total 20
3094308 -rw------- 1 username group 5 Sep 14 17:21 file
3094311 -rw------- 1 username group 5 Sep 14 17:21 file2
3094312 -rw------- 1 username group 5 Sep 14 17:21 file3
3094313 -rw------- 1 username group 5 Sep 14 17:21 file4
3094314 -rw------- 1 username group 5 Sep 14 17:21 file5
3094315 drwx------ 1 username group 48 Sep 14 17:22 subdirectory
./subdirectory:
total 20
3094316 -rw------- 1 username group 5 Sep 14 17:22 file
3094332 -rw------- 1 username group 5 Sep 14 17:22 file2
3094345 -rw------- 1 username group 5 Sep 14 17:22 file3
3094346 -rw------- 1 username group 5 Sep 14 17:22 file4
3094347 -rw------- 1 username group 5 Sep 14 17:22 file5
Todos os arquivos têm números de inode separados, tornando-os arquivos separados. Agora vamos desduplicá-los:
$ fdupes -r -1 . | while read line; do j="0"; for file in ${line[*]}; do if [ "$j" == "0" ]; then j="1"; else ln -f ${line// .*/} $file; fi; done; done
$ ls -ilR
.:
total 20
3094308 -rw------- 10 username group 5 Sep 14 17:21 file
3094308 -rw------- 10 username group 5 Sep 14 17:21 file2
3094308 -rw------- 10 username group 5 Sep 14 17:21 file3
3094308 -rw------- 10 username group 5 Sep 14 17:21 file4
3094308 -rw------- 10 username group 5 Sep 14 17:21 file5
3094315 drwx------ 1 username group 48 Sep 14 17:24 subdirectory
./subdirectory:
total 20
3094308 -rw------- 10 username group 5 Sep 14 17:21 file
3094308 -rw------- 10 username group 5 Sep 14 17:21 file2
3094308 -rw------- 10 username group 5 Sep 14 17:21 file3
3094308 -rw------- 10 username group 5 Sep 14 17:21 file4
3094308 -rw------- 10 username group 5 Sep 14 17:21 file5
Os arquivos agora têm o mesmo número de inode, o que significa que todos apontam para o mesmo dados físicos no disco.
Espero que isso resolva seu problema ou, pelo menos, direcione você na direção certa!