O x54 x79 é o "Ty" em ASCII, que é válido ISO-8859-1 e UTF-8, mas o xF6 x6B x69 x72 é "ökir", na codificação ISO-8859-1 e NÃO é válido UTF- 8 Que está sendo traduzido das duas maneiras em algum lugar entre assustador e brilhante. O que traz a questão de saber se o sistema de arquivos está envolvido.
A maioria dos sistemas de arquivos Unix são bastante agnósticos em relação aos conjuntos de caracteres - eles simplesmente fazem bytes. Você pode verificar ambos os sistemas de arquivos, se houver dois (um não pode ser ext3), os detalhes sobre como eles são montados e descobrir se o caminho através de ~ / public_html / adm / email / upload / está passando pelo NFS ou algo como ele, que pode estar colocando em camadas outro caractere do sistema de arquivos sobre o subjacente - o Samba seria uma coisa muito interessante para se encontrar lá, já que ele tem opções explícitas de charset.
É claro que verificar se LC_CTYPE está definido de forma estranha também é uma boa ideia:
$ touch Työelämätrendit.csv
$ ls T*
Työelämätrendit.csv
$ LC_CTYPE=C ls T*
Ty??el??m??trendit.csv
$
Talvez o LC_CTYPE não tenha sido definido no processo do SVN? Não é difícil de acontecer, quando está sendo executado indiretamente por um servidor web, um trabalho em lote, etc.