Você pode querer verificar a diretiva "delay_pool" listada em seu exemplo - não deveria ser "delay_pools" (com um 's')? Eu testei localmente (bem, com o Squid 2.7 e não 3) e isso causou a falha de todos os delay_pools.
Em relação à questão 1, as ACLs são OR'ed. Aqui está um exemplo de como eu usá-lo para não usar pools de atraso para acesso a recursos internos através do nosso proxy:
acl delay_pool_local_1 dst 192.168.0.0/24
acl delay_pool_local_2 dst 192.168.1.0/24
delay_access 1 allow delay_pool_local_1
delay_access 1 allow delay_pool_local_2
delay_access 1 deny all
Em relação à pergunta 2, você vai querer colocar cada diretiva ACL em sua própria linha.
Para a pergunta 3, a resposta simples é que, com base no seu exemplo, os "intervalos" de largura de banda disponíveis para cada cliente sempre serão reabastecidos instantaneamente. Então eles nunca estarão vazios.
A explicação mais longa é que os "buckets" sempre serão preenchidos na taxa especificada. Um cliente começará com a quantidade de largura de banda delay_initial_bucket_level. Conforme o cliente faz o download, os dados são removidos do intervalo. Portanto, se você especificar delay_initial_bucket_level 50, os intervalos começarão com 50% de preenchimento. Em seu exemplo acima, os buckets sempre são reabastecidos instantaneamente (porque são especificados como "100000/100000", por exemplo), o que significa que o cliente é simplesmente acelerado para 100000. Se você especificou 5000/100000, os buckets seriam "reabastecidos" em um taxa de 5000. Nesse caso, o balde será reabastecido na taxa normal, mesmo que o ACL não esteja sendo usado no momento.