Ha! Finalmente resolvi isso. No include você tem que incluir o caminho completo para todos os diretórios - mas NÃO o URL:
wget -r -A xls,xlsx,"" -l 2 -I /government/uploads/system/uploads/attachment_data/file/,/government/publications/,/government/collections/departmental-spend-over-500 https://www.gov.uk/government/collections/departmental-spend-over-500
Não é óbvio - bem, não para mim de qualquer maneira ...
(role para a direita na caixa de código para ver tudo)
Editar: na verdade, melhor - eu dividi isso aqui:
wget -r -A xls,xlsx,"" -l 2
-I /government/uploads/system/uploads/attachment_data/file/,
/government/publications/,
/government/collections/departmental-spend-over-500
https://www.gov.uk/government/collections/departmental-spend-over-500
Linha 1: recursiva, inclua xls & xlsx & arquivos que não possuem extensões (neste caso, arquivos html ...) e fazem dois níveis de onde especificado na linha 5
Linhas 2-4: inclua esses caminhos / diretórios na URL superior (ou seja, exclua tudo o mais)
Linha 5: por onde começar