Eu estava pesquisando por horas para encontrar uma solução para o meu problema e não consegui fazê-lo funcionar:
Eu tenho que rsync uma estrutura de arquivo em uma unidade formatada em ext4 para uma unidade hfs + formatada. Pastas e nomes de arquivos podem conter umlauts alemão (äöüß) e o manuseio do UTF8 é diferente entre o OS X e o Linux. Os sistemas de arquivos OS X usam o NFD (Unicode Normalization Form D), no qual o Linux usa o Form C (NFC).
Esse comportamento causa a exclusão e nova sincronização de arquivos com umlauts em seus nomes, o que produz uma grande sobrecarga desnecessária, especialmente se você rsync com a opção --backup
.
Uma solução para evitar esse comportamento é o uso de --iconv=UTF8,UTF8-MAC
, mas isso funciona apenas com um iconvlib mais recente em um Mac. O atual iconvlib no Ubuntu 14.04 não suporta o pseudo-charset UTF8-MAC:
root@ubuntu:~/wartung# iconv -l
...
UTF-7, UTF-8, UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE, UTF-32LE, UTF7, UTF8, UTF16, UTF16BE, UTF16LE, UTF32, UTF32BE, UTF32LE, ...
OS X com o rsync mais recente do homebrew, faça:
bash-3.2$ iconv -l
ANSI_X3.4-1968 ANSI_X3.4-1986 ASCII CP367 IBM367 ISO-IR-6 ISO646-US ISO_646.IRV:1991 US US-ASCII CSASCII
UTF-8 UTF8
**UTF-8-MAC UTF8-MAC**, ...
Perguntas e respostas relacionadas ao meu problema são:
rsync --iconv opção no Mac não está funcionando (sincronização de servidor Linux remoto para Mac local)
Convertendo nomes de arquivos NFD UTF-8 para NFC UTF-8, em rsync ou afpd
EDITAR
Com um pouco de mexer eu poderia re-compilar o libiconv para o Ubuntu:
sudo -i
# Get the libiconv sources
wget https://ftp.gnu.org/gnu/libiconv/libiconv-1.14.tar.gz
tar -xzvf ./libiconv-1.14.tar.gz -C /usr/src && cd /usr/src/libiconv-1.14
# Get the patch for the Makefile
wget https://raw.githubusercontent.com/Homebrew/patches/9be2793af/libiconv/patch-Makefile.devel
patch -p1 ./Makefile.devel < patch-Makefile.devel
# Get the patch for the translation file
wget https://raw.githubusercontent.com/Homebrew/patches/9be2793af/libiconv/patch-utf8mac.diff
patch -p1 < ./patch-utf8mac.diff
# Replace utf8mac.h file
rm lib/utf8mac.h && cd lib
wget http://opensource.apple.com/source/libiconv/libiconv-9/libiconv/lib/utf8mac.h?txt -O utf8mac.h
# Append flags.h with utf8mac
echo "#define ei_utf8mac_oflags (HAVE_ACCENTS | HAVE_QUOTATION_MARKS | HAVE_HANGUL_JAMO)" >> flags.h
# Edit stdio.h.in to prevent gcc errors because of insecure 'gets' function
cd ../srclib
sed -i -- 's/(gets/(fgets/g' ./stdio.in.h
# compile & install ...
cd ..
./configure
make -f ./Makefile.devel
make
checkinstall
Até esse passo, tudo funciona bem. Além disso, tive que definir o caminho para a biblioteca compartilhada com ...
touch /etc/ld.so.conf.d/libiconv.conf
echo "/usr/local/lib" > /etc/ld.so.conf.d/libiconv.conf
ldconfig
Agora o pseudo-charset também está disponível no Ubuntu:
root@ubuntu:/# iconv -l
ANSI_X3.4-1968 ANSI_X3.4-1986 ASCII CP367 IBM367 ISO-IR-6 ISO646-US ISO_646.IRV:1991 US US-ASCII CSASCII
UTF-8
**UTF-8-MAC UTF8-MAC**, ...
Mas surpresa surpresa - não está disponível no rsync!
root@ubuntu:/# rsync --iconv=UTF8,UTF8-MAC --force --ignore-errors --delete --numeric-ids --archive --hard-links --sparse --backup --backup-dir=/path/to/TEMP/ /path/SOURCE/ /path/TARGET/
iconv_open("UTF-8", "UTF8-MAC") failed
rsync error: requested action not supported (code 4) at rsync.c(121) [Receiver=3.1.0]
rsync: connection unexpectedly closed (0 bytes received so far) [sender]
rsync error: error in rsync protocol data stream (code 12) at io.c(226) [sender=3.1.0]
Quando eu testo iconv com um documento, o pseudo-charset funciona. O que há de errado com o rsync? Obrigado por você ajuda!