O comando linux pode manipular arquivos de texto codificados em UTF-8?

1

Eu quero comparar dois arquivos de texto codificados em UTF-8. O comando Linux diff e comm pode lidar com essas codificações?

    
por user41451 04.02.2017 / 12:42

2 respostas

3

Por que não?

2 arquivos de texto em russo

$ file -i test1.txt test2.txt                                                                                                                                                    
test1.txt: text/plain; charset=utf-8                                                                                                                                                                               
test2.txt: text/plain; charset=utf-8

$ cat test1.txt                                                                                                                                                                  
Привет                     

$ cat test2.txt                                                                                                                                                                  
Добрый день                                                                                                                                                                                                        

$ diff test1.txt test2.txt                                                                                                                                                       
1c1                                                                                                                                                                                                                
< Привет                                                                                                                                                                                                           
---                                                                                                                                                                                                                
> Добрый день                                                                                                                                                                                                      
    
por 04.02.2017 / 13:23
0

Use o parâmetro -i para forçar o arquivo a imprimir informações sobre a codificação

Eu criei dois arquivos contendo alguns caracteres

Um codificado em utf-8 e um codificado em iso-8859-1

$ file -i *
file1: text/plain; charset=utf-8
file2: text/plain; charset=iso-8859-1
    
por 04.02.2017 / 12:49