Você pode usar isso se estiver em um pequeno sistema endian:
iconv -f utf-8 -t ucs-4le | od -tx4
ou isto se você estiver em um sistema big endian:
iconv -f utf-8 -t ucs-4be | od -tx4
Eu uso od
para imprimir o octal ou o hex de um arquivo / stdin / string. Isso me permite ver os valores codificados em ASCII ou UTF-8 do meu stdin.
Mas nós não vivemos mais na ASCIIland. Existe algum comando que irá imprimir os valores unicode / codepoints para a entrada (presumida) utf-8 codificada? Eu quero saber quais personagens unicode estou vendo?
Tags command-line debugging text unicode