Divide os arquivos recuados dos separadores Tab e Space

1

Eu estava usando o comando file para coletar informações sobre alguns arquivos de texto (bem, arquivos XML, mas as informações XML não me interessavam), mas havia um pouco de informação que perdi na saída: se o arquivo foi recuado com guias ou espaços.

Existe algum comando que me dê isso? Ou qualquer tipo de configuração que eu possa usar para obter file para exibir essa informação?

Eu sei que posso usar grep -l -P "^\x09" , por exemplo, mas estou procurando algo que já faça o que eu preciso e, presumivelmente, já passei por todos os casos que ainda não pensei.

    
por Daniel C. Sobral 23.06.2018 / 23:25

1 resposta

0

Para detectar corretamente o recuo em um formato de texto estruturado, o comando file teria que implementar um analisador adequado para esse formato. A ocorrência da seqüência de caracteres \n␣ (nova linha seguida por um espaço) não é suficiente para dizer que o arquivo é recuado por espaços, já que a sequência de caracteres pode ocorrer dentro de um atributo XML.

Não acho que guias literais possam ocorrer sem codificação em atributos XML, mas não tenho certeza sobre CDATA sections.

    
por 24.06.2018 / 08:42