Se você passar o mouse sobre a seta verde / cinza com o ponteiro do mouse, verá que o verde realmente indica que a entrada foi capturada e que o cinza não é: o oposto do que você disse.
Por um tempo, o Linux no VirtualBox irá capturar automaticamente, uma vez que a janela obtenha foco clicando nela ou Alt-Tabbing nela. (Eu tentei isso agora com o Ubuntu 12.04 no VirtualBox 4.2)
Observe que, mesmo que você pressione Ctrl para liberar a captura (e a seta estiver cinza), a maioria dos pressionamentos de tecla ainda irá para a janela, desde que mantenha o foco. As exceções notáveis são aquelas como Alt-Tab (experimente com a seta verde e cinza).
EDIT: você pode dar um exemplo de quando "a VM recebe entrada do Windows"? Em qualquer caso, desativar a captura automática - na principal Janela do gerenciador, "Arquivo" - > "Preferências" - > "Input" - > "Auto-capture keyboard" , e não se esqueça de clicar em OK - faça o que quiser?