Por "teste" você quer dizer "validar que certos pacotes e programas existem e que eles são executados como esperado"?
Se assim for, não posso falar com as partes específicas do Mac, mas minha abordagem seria incluir um pequeno programa XML-RPC como parte da imagem. Não precisa ser XML-RPC, mas essa é uma abordagem que eu já achei útil antes.
O programa exporia uma API na caixa para vários testes. Por padrão, ele seria executado quando a máquina inicializasse, escutando (digamos) a porta 8080. Seu script de controle se conectaria e executaria uma sequência de comandos, estilo de teste de unidade. Você pode controlar o nível de exposição, desde "existe este diretório" até "o que acontece quando você executa o photoshop".
Como eu disse, isso não é interessante para Mac, mas seria uma solução simples e portátil.
PS
Depois de passar nos testes, o pacote poderia responder a um comando final para se remover da imagem:)