O programa TXR Lisp abaixo, chamado pcap.tl
, é usado da seguinte forma:
$ tcpdump -s 1024 -w - | ~/txr/txr pcap.tl
Analisa a saída do formato pcap em -w
e produz a saída como:
192.168.1.102 --> 192.168.1.146
ether hdr: #S(eth-header dst-mac #(8 0 39 249 113 4) src-mac #(0 30 79 164 102 184) eth-type ETH_IPV4)
ipv4 hdr: #S(ipv4-header ihl 5 ver 4 ecn 0 dscp 0 len 101 ident 7434 fragoffs-hi 0 flags 2
fragoffs-lo 0 ttl 64 proto 6 hdr-sum 39232 src-ip 3232235878
dst-ip 3232235922)
ipv4 payload as text: P��.;;�.�+i�.6�...
KK-?9rrt2b
春が来た (Haru-ga Kita/Spring has Com
O código usa declarações de tipo FFI para definir os tipos de estrutura correspondentes ao arquivo pcap e formato de pacote, cabeçalhos de ethernet e cabeçalhos ipv4. O cabeçalho ipv4 é definido de duas maneiras diferentes para máquinas big e little endian, porque depende de campos de bits.
Recebemos toda a carga IPv4 como um dado UTF-8, decodificamos, substituímos caracteres de controle por pontos e imprimimos.
(defvarl big-endian-p (= 1 (ffi-get (ffi-put 1 (ffi be-uint32)) (ffi uint32))))
(defvarl little-endian-p (not big-endian-p))
(typedef ll-t (enumed uint32 ll-t
DLT_NULL DLT_EN10MB))
(typedef eth-t (enumed be-uint16 eth-t
(ETH_IPV4 #x0800)
(ETH_ARP #x0806)
(ETH_IPV6 #x08DD)))
(typedef pcap-header (struct pcap-header
(magic uint32)
(majver uint16)
(minver uint16)
(tzoffs uint32)
(tzprec uint32)
(snaplen uint32)
(lltype ll-t)))
(typedef pkt-header (struct pkt-header
(tsec uint32)
(tfrac uint32)
(trunclen uint32)
(origlen uint32)))
(typedef eth-header (struct eth-header
(dst-mac (array 6 uint8))
(src-mac (array 6 uint8))
(eth-type eth-t)))
(cond
(big-endian-p
(typedef ipv4-header (struct ipv4-header
(ver (bit 4 uint8))
(ihl (bit 4 uint8))
(dscp (bit 6 uint8))
(ecn (bit 2 uint8))
(len uint16)
(ident uint16)
(flags (bit 3 uint8))
(fragoffs-hi (bit 5 uint8))
(fragoffs-lo uint8)
(ttl uint8)
(proto uint8)
(hdr-sum uint16)
(src-ip uint32)
(dst-ip uint32))))
(little-endian-p
(typedef ipv4-header (struct ipv4-header
(ihl (bit 4 uint8))
(ver (bit 4 uint8))
(ecn (bit 2 uint8))
(dscp (bit 6 uint8))
(len be-uint16)
(ident be-uint16)
(fragoffs-hi (bit 5 uint8))
(flags (bit 3 uint8))
(fragoffs-lo uint8)
(ttl uint8)
(proto uint8)
(hdr-sum be-uint16)
(src-ip be-uint32)
(dst-ip be-uint32)))))
;; Look for IPv4 packets and print headers
(defun decode-packet (phdr buf)
(let ((eh (ffi-get buf (ffi eth-header))))
(unless (eq eh.eth-type 'ETH_IPV4)
(return-from decode-packet))
(let* ((ih (ffi-get buf (ffi ipv4-header) (sizeof eth-header)))
(hdrsz (+ (sizeof eth-header) (sizeof ipv4-header)))
(len (- (length buf) hdrsz))
(body (carray-buf buf (ffi char) hdrsz))
(rawtext (carray-get body))
(text (mapcar (iffi [andf chr-iscntrl [notf chr-isspace]] (ret #\.))
rawtext)))
(put-line '@(str-inaddr ih.src-ip) --> @(str-inaddr ih.dst-ip)')
(put-line ' ether hdr: @eh')
(put-line ' ipv4 hdr: @ih')
(put-line ' ipv4 payload as text: @text'))))
;; main program
(let ((*stdin* (open-fileno (fileno *stdin*) "rbu")) ;; binary, unbuffered
(hdr (new pcap-header))
(hdr-buf (make-buf (sizeof pcap-header)))
(phdr (new pkt-header))
(phdr-buf (make-buf (sizeof pkt-header)))
(pay-buf (make-buf 65536)))
;; read pcap file header
(when (< (fill-buf hdr-buf) (sizeof pcap-header))
(return))
;; decode to structure
(ffi-in hdr-buf hdr (ffi pcap-header) t)
(unless (eq hdr.lltype 'DLT_EN10MB)
(put-line "can only deal with Ethernet frames")
(exit nil))
;; read and decode packets
(while t
(when (< (fill-buf phdr-buf) (sizeof pkt-header))
(return))
(ffi-in phdr-buf phdr (ffi pkt-header) t)
(buf-set-length pay-buf phdr.trunclen)
(when (< (fill-buf pay-buf) phdr.trunclen)
(return))
(decode-packet phdr pay-buf)))
A ação de decodificação UTF-8 ocorre nas seguintes linhas:
(body (carray-buf buf (ffi char) hdrsz))
(rawtext (carray-get body))
body
está vinculado a um objeto carray
sobreposto a buf
, com um deslocamento de hdrsz
, para enviar o cabeçalho ethernet e IPV4. O tipo de elemento é char
. Ele ocupa todo o restante do buffer após o cabeçalho.
Então (carray-get body)
transforma todo o valor estrangeiro em uma string Lisp. Como o tipo de elemento é char
, a conversão UTF-8 entra em ação: um comportamento especial para matrizes de char
. Se o tipo fosse bchar
, seria apenas os bytes como caracteres 1: 1. Se o tipo fosse wchar
, a matriz seria de wchar_t
caracteres, convertida em uma string de acordo. Para obter um vetor de bytes numéricos em vez de uma string, podemos fazer o tipo de elemento uchar
ou uint8
.
Este programa é fácil de estender para lidar com TCP, UDP, IPv6, o que for necessário. Pode procurar correspondências específicas em campos de cabeçalho específicos.