nomes de arquivos em árabe alterados para unicode

1

O arquivo zip copiado do backup do site do host antigo que tinha nomes de arquivos em árabe, quando descompactado na nova instalação de nomes de arquivos do Ubuntu, de alguma forma foi alterado para unicode.

Nome do arquivo original: إدارة-المكتب-الفني-للمدير-العام-1024x198.jpg

Nome alterado para #U0627#U0633#U062a#U0634#U0627#U0631#U0627#U062a-1024x198.jpg Não tenho certeza se peguei o arquivo correto porque não consigo identificar os arquivos corretos.

Tentei usar wget , mas existem cerca de 6786 arquivos que parecem ser uma tarefa a ser feita um a um e mais eu não sei quais arquivos remover, pois haverá arquivos duplicados com nome diferente e ocuparão espaço desnecessário. Tentei usar convmv -r -f windows-1252 -t UTF-8 . , mas sem uso.

ubuntu@ip-XX-XX-XX-XX:/var/www/html/wp-content/uploads/2016/03$ convmv -f windows-1252 -t UTF-8 #U0627#U0633#U062a#U0634#U0627#U0631#U0627#U062a-1024x198.jpg
perl: warning: Setting locale failed.
perl: warning: Please check that your locale settings:
    LANGUAGE = (unset),
    LC_ALL = (unset),
    LC_CTYPE = "UTF-8",
    LANG = "en_US.UTF-8"
    are supported and installed on your system.
perl: warning: Falling back to the standard locale ("C").
Your Perl version has fleas #22111 #37757 #49830 
convmv 1.15 - converts filenames from one encoding to another
Copyright (C) 2003-2011 Bjoern JACKE <[email protected]>

This program comes with ABSOLUTELY NO WARRANTY; it may be copied or modified
under the terms of the GNU General Public License version 2 or 3 as published
by the Free Software Foundation.

 USAGE: convmv [options] FILE(S)
-f enc     encoding *from* which should be converted
-t enc     encoding *to* which should be converted
-r         recursively go through directories
-i         interactive mode (ask for each action)
--nfc      target files will be normalization form C for UTF-8 (Linux etc.)
--nfd      target files will be normalization form D for UTF-8 (OS X etc.)
--qfrom    be quiet about the "from" of a rename (if it screws up your terminal e.g.)
--qto      be quiet about the "to" of a rename (if it screws up your terminal e.g.)
--exec c   execute command instead of rename (use #1 and #2 and see man page)
--list     list all available encodings
--lowmem   keep memory footprint low (see man page)
--nosmart  ignore if files already seem to be UTF-8 and convert if posible
--notest   actually do rename the files
--replace  will replace files if they are equal
--unescape convert%20ugly%20escape%20sequences
--upper    turn to upper case
--lower    turn to lower case
--parsable write a parsable todo list (see man page)
--help     print this help
ubuntu@ip-XX-XX-XX-XX:/var/www/html/wp-content/uploads/2016/03$

Existe alguma maneira de encontrar qual codificação está sendo usada e alterá-la de volta para o nome do arquivo original?

Hospedagem antiga mostrando os arquivos na codificação correta Nova hospedagem mostrando os arquivos em unicode com codificação hash

    
por Nabeel Khan 07.05.2016 / 06:02

0 respostas