Um processador é definitivamente necessário para realizar o download, você precisa de poder de processamento para converter os padrões de bits recebidos em seu adaptador de rede para a representação de dados desejada (ou seja, você precisa executar a pilha TCP / IP). Dito isto, a rede e o dispositivo de armazenamento provavelmente serão ordens de magnitude mais lentas que um processador de baixo custo, por isso não é nada que você deva se preocupar em geral.
Por exemplo, uma das pequenas e rápidas pilhas TCP / IP , será executado em um ATMega88 . Este é um processador de 8 bits projetado para rodar a 20 MHz. Em teoria, esse processador é mais que suficiente para controlar uma pilha TCP / IP e, portanto, suficiente para baixar dados.
É claro que quando se chega a esse tipo de CPU, a quantidade de dados que podem ser baixados pode ser limitada pela frequência do clock. Os fatores limitantes serão os ciclos de clock necessários para executar a pilha TCP / IP e os ciclos de clock necessários para armazenar os dados em algum tipo de armazenamento.
Se tomarmos o seu exemplo, e fizermos alguns cálculos muito pouco científicos e improvisados: Uma conexão de 3mbps equivale a 384kByte de dados brutos recebidos por segundo. Se o seu processador funcionar a 20 MHz, ele terá algo em torno de (20 * 10 ^ 6) / (384 * 1024), o que equivale aproximadamente a 50 instruções por byte bruto de dados recebidos. Não sou especialista na pilha TCP / IP, mas acredito que seria muito difícil espremer uma implementação para que seja eficiente. Você pode querer um processador melhor para obter um throughput sólido de 3mpbs.
De qualquer forma, se você planeja usar isso para projetar qualquer coisa, você deve testar primeiro o hardware real e a pilha TCP / IP real que você planeja usar.