Eu realmente escrevi muita documentação técnica no Word. Não é a ferramenta que eu escolheria se tivesse uma escolha livre, mas os escritores de tecnologia geralmente não o fazem.
O que você está falando certamente é possível - mas eu só posso dizer isso quando fizer algumas suposições sobre como você vai entregar o manual. Se você planeja entregar o manual como um PDF e colocar essas capturas de tela externas na Web, é possível fazê-lo. O Word 2010 permite incorporar links de URL em qualquer parte do documento. Esses links são preservados quando você salva o arquivo como PDF.
Acho que você está fazendo uma suposição ruim aqui, e isso é que uma captura de tela precisa mostrar a janela inteira do aplicativo. Costumo capturar apenas o suficiente da janela para que o usuário possa identificar a mesma coisa em seu próprio monitor.
Você não perguntou sobre softwares, mas vou recomendar alguns de qualquer maneira. No Windows, o SnagIt é a ferramenta indispensável de captura de tela. Sempre foi bom e só melhorou ao longo dos anos. O mecanismo de captura continua ficando cada vez mais poderoso e fácil de usar, e agora a maldita coisa vem com um editor de gráficos muito bom, o ideal para desenhar esses textos explicativos.