Eu tenho um Macbook Pro com o Radeon Pro 460 e tentei treinar um classificador usando o Caffe que tem um branch OpenCL. Com base na minha experiência, a velocidade de treinamento do modelo na GPU foi igualmente a mesma se você fizer isso na CPU! Eu também tentei fazer a mesma coisa em um Mac com Nvidia 960 e adivinhe; foi 40 vezes mais rápido! A CUDA utilizou estruturas bastante otimizadas para cálculos com matrizes pesadas que, infelizmente, não estão disponíveis nas placas gráficas AMD. Então, se o seu objetivo é executar NNs baseados em GPU, minha recomendação pessoal seria escolher algo com a Nvidia Graphics.