O arquivo zip copiado do backup do site do host antigo que tinha nomes de arquivos em árabe, quando descompactado na nova instalação de nomes de arquivos do Ubuntu, de alguma forma foi alterado para unicode.
Nome do arquivo original:
إدارة-المكتب-الفني-للمدير-العام-1024x198.jpg
Nome alterado para #U0627#U0633#U062a#U0634#U0627#U0631#U0627#U062a-1024x198.jpg
Não tenho certeza se peguei o arquivo correto porque não consigo identificar os arquivos corretos.
Tentei usar wget
, mas existem cerca de 6786 arquivos que parecem ser uma tarefa a ser feita um a um e mais eu não sei quais arquivos remover, pois haverá arquivos duplicados com nome diferente e ocuparão espaço desnecessário. Tentei usar convmv -r -f windows-1252 -t UTF-8 .
, mas sem uso.
ubuntu@ip-XX-XX-XX-XX:/var/www/html/wp-content/uploads/2016/03$ convmv -f windows-1252 -t UTF-8 #U0627#U0633#U062a#U0634#U0627#U0631#U0627#U062a-1024x198.jpg
perl: warning: Setting locale failed.
perl: warning: Please check that your locale settings:
LANGUAGE = (unset),
LC_ALL = (unset),
LC_CTYPE = "UTF-8",
LANG = "en_US.UTF-8"
are supported and installed on your system.
perl: warning: Falling back to the standard locale ("C").
Your Perl version has fleas #22111 #37757 #49830
convmv 1.15 - converts filenames from one encoding to another
Copyright (C) 2003-2011 Bjoern JACKE <[email protected]>
This program comes with ABSOLUTELY NO WARRANTY; it may be copied or modified
under the terms of the GNU General Public License version 2 or 3 as published
by the Free Software Foundation.
USAGE: convmv [options] FILE(S)
-f enc encoding *from* which should be converted
-t enc encoding *to* which should be converted
-r recursively go through directories
-i interactive mode (ask for each action)
--nfc target files will be normalization form C for UTF-8 (Linux etc.)
--nfd target files will be normalization form D for UTF-8 (OS X etc.)
--qfrom be quiet about the "from" of a rename (if it screws up your terminal e.g.)
--qto be quiet about the "to" of a rename (if it screws up your terminal e.g.)
--exec c execute command instead of rename (use #1 and #2 and see man page)
--list list all available encodings
--lowmem keep memory footprint low (see man page)
--nosmart ignore if files already seem to be UTF-8 and convert if posible
--notest actually do rename the files
--replace will replace files if they are equal
--unescape convert%20ugly%20escape%20sequences
--upper turn to upper case
--lower turn to lower case
--parsable write a parsable todo list (see man page)
--help print this help
ubuntu@ip-XX-XX-XX-XX:/var/www/html/wp-content/uploads/2016/03$
Existe alguma maneira de encontrar qual codificação está sendo usada e alterá-la de volta para o nome do arquivo original?
Hospedagem antiga mostrando os arquivos na codificação correta Nova hospedagem mostrando os arquivos em unicode com codificação hash