Executando o arquivo de log por meio de ordenação | O uniq deve filtrar as linhas duplicadas, mas eu questionaria porque você tem essas linhas lá. Eles são realmente duplicados?
Se forem entradas de registro legítimas e você quiser apenas uma lista exclusiva de clientes (o segundo campo) para linhas que não sejam duplicatas, uma simples modificação do script do @ Thor deverá fornecer o que você deseja:
awk '
/CONNECT/ {
if (seen[$0] == 0) {
clients[$3]++
}
seen[$0]++
}
END {
for (i in clients) {
print i
}
}'
Que para a amostra que você deu resultados:
192.168.2.3
Isso não é tão compacto quanto o roteiro de Thor, mas eu geralmente acho que, assim que eu escrevo algo assim, eu quero fazer mais com as linhas, então eu deixei o array visto contagem de linhas únicas) lá.