Assumindo que glenn jackman paráfrase da sua pergunta está correta, aqui está uma solução usando awk
e substr()
:
awk '{key = substr($0,1,4)}; !(key in printed); {printed[key]}' file
Isso define "chave" para os primeiros quatro caracteres de uma linha, depois imprime a linha a menos que tenha visto essa chave antes, e depois acompanha o fato de que essa chave foi impressa.