diff - como ignorar linhas vazias

4

Eu preciso diferenciar dois arquivos ignorando todos os espaços em branco e linhas vazias / em branco, mas por algumas razões as opções de diff que eu encontrei não funcionam bem, ele continua mostrando a linha vazia no arquivo1 ...

$ cat file1
2 nodes configured
13 resources configured

$ cat file2
2 nodes configured
23 resources configured
$ diff -ywBEZb -W 200 --suppress-blank-empty --suppress-common-lines file1 file2
13 resources configured                                                                            |    23 resources configured
                                                                                                   <
$ od -bc file1
0000000 062 040 156 157 144 145 163 040 143 157 156 146 151 147 165 162
          2       n   o   d   e   s       c   o   n   f   i   g   u   r
0000020 145 144 012 061 063 040 162 145 163 157 165 162 143 145 163 040
          e   d  \n   1   3       r   e   s   o   u   r   c   e   s
0000040 143 157 156 146 151 147 165 162 145 144 012 012
          c   o   n   f   i   g   u   r   e   d  \n  \n
0000054
$ od -bc file2
0000000 062 040 156 157 144 145 163 040 143 157 156 146 151 147 165 162
          2       n   o   d   e   s       c   o   n   f   i   g   u   r
0000020 145 144 012 062 063 040 162 145 163 157 165 162 143 145 163 040
          e   d  \n   2   3       r   e   s   o   u   r   c   e   s
0000040 143 157 156 146 151 147 165 162 145 144 012
          c   o   n   f   i   g   u   r   e   d  \n
0000053
$ diff -ywBEZb -W 200 --suppress-blank-empty --suppress-common-lines file1 file2 | od -bc -
0000000 061 063 040 162 145 163 157 165 162 143 145 163 040 143 157 156
          1   3       r   e   s   o   u   r   c   e   s       c   o   n
0000020 146 151 147 165 162 145 144 011 011 011 011 011 011 011 011 011
          f   i   g   u   r   e   d  \t  \t  \t  \t  \t  \t  \t  \t  \t
0000040 011 040 040 040 174 011 062 063 040 162 145 163 157 165 162 143
         \t               |  \t   2   3       r   e   s   o   u   r   c
0000060 145 163 040 143 157 156 146 151 147 165 162 145 144 012 011 011
          e   s       c   o   n   f   i   g   u   r   e   d  \n  \t  \t
0000100 011 011 011 011 011 011 011 011 011 011 040 040 040 074 012
         \t  \t  \t  \t  \t  \t  \t  \t  \t  \t               <  \n
0000117
$
    
por Chris 10.02.2018 / 10:27

2 respostas

5

Use a opção -B :

-B  --ignore-blank-lines  Ignore changes whose lines are all blank.

Para ignorar os espaços em branco, use as opções -b e -w :

-b  --ignore-space-change  Ignore changes in the amount of white space.
-w  --ignore-all-space  Ignore all white space.

Ou simplesmente RTM .

EDITAR:

Como -B (e alguns outros diff switches) parece não estar funcionando (não encontrei nenhuma informação se foi reportado como bug), você precisa usar uma maneira diferente de ignorar linhas em branco e espaços em branco .

Eu sugeriria algo assim:

[my@pc ~]$ cat file1.txt
2 nodes configured

13 resources configured

[my@pc ~]$ cat file2.txt
2 nodes configured
23 resources configured
[my@pc ~]$ diff <(grep -vE '^\s*$' file1.txt)  <(grep -vE '^\s*$' file2.txt)
2c2
< 13 resources configured
---
> 23 resources configured
    
por 10.02.2018 / 10:35
1

Eu posso ajudar com o comando para excluir as linhas vazias e os espaços em branco com o comando sed

Para excluir linhas vazias ou em branco, use o comando abaixo

sed '/^$/d' filename

Para remover espaços em branco nas linhas

sed -r "s/\s+//g" filename

Depois de executar o comando acima, você pode usar o comando diff para saber a diferença entre 2 arquivos

    
por 10.02.2018 / 10:43

Tags