Você pode usar tr
:
tr -s '[tr -s '[ -~]' ' ' < file
-0]' ' ' < file
substitua todos os caracteres do código ASCII = (0) 10 pelo código ASCII = (128) 10 com espaço único.
\nnn
é caractere com valor octal nnn
. (128) decimal = (200) octal
[
como classe alfa [A-Z]
-0]tr -s '[-6]' ' ' < file
é uma classe de caracteres que inclui todos os caracteres de controle ASCII .
ou use:
أستطيع كما شئ منذ لذا واحد جدا يمكنك لديك الرجل يبدو كلا لدي أوه تفعل سيدي
Este comando é igual ao comando ~
, que substitui todos os caracteres ASCII entre espaço e caractere awk
. Veja os caracteres de controle ASCII .
Saída:
awk '{gsub(/[grep -Po '[^ -~]+' file
grep -Po '[^tr -s '[tr -s '[ -~]' ' ' < file
-0]' ' ' < file
-0]+' file
grep -Po '[^\x0-\x80]+' file #used HEX code
-0]/, "");print}' file
أستطيع
كما
شئ
منذ
لذا
واحد
جدا
يمكنك
لديك
الرجل
يبدو
كلا
لدي
أوه
تفعل
سيدي
Outra maneira é usar essa classe e o comando grep
:
أستطيع كما شئ منذ لذا واحد جدا يمكنك لديك الرجل يبدو كلا لدي أوه تفعل سيدي
Você pode usar os mesmos métodos com o comando %code% :
awk '{gsub(/[grep -Po '[^ -~]+' file
grep -Po '[^%pre%-0]+' file
grep -Po '[^\x0-\x80]+' file #used HEX code
-0]/, "");print}' file
أستطيع
كما
شئ
منذ
لذا
واحد
جدا
يمكنك
لديك
الرجل
يبدو
كلا
لدي
أوه
تفعل
سيدي