Estou executando um computador com 4 Nvidia Titan X para treinamento de redes neurais profundas. Eu tenho problemas com meu consumo de energia. O consumo de Titan X não deve estar acima de 250W, mas como você pode ver no gráfico, ele pode estar acima de 350W. Quando uso o nvidia-smi para monitorar o consumo de energia, o parâmetro limite de potência imposto é definido como 250W como deveria.
Nocomeçoeupenseiquenãoeraumproblema,anãoserqueeunãopudesserodartodasas4GPUssimultaneamentenomeuPSACorsairAxide1200W.Noentanto,quandoexperimenteiumaredeneuraldiferente,maiscomputacionalmentecaraemumúnicoGPU,travoocomputador.Naverdade,euqueimeioPSUeenvieidevolta.EucompreiagoraumaPSUmaior(1600W)masnãoqueroteromesmoproblemanovamente.NãomelembrodecomoaPSUfoiconectada,mastalvezaGPUqueuseiestejaconectadacomalgosemelhantea isto pois o Titan x precisa de 2 conectores pci-e a minha PSU tinha apenas 8 (4 * 2 para GPUs e 1 para CPU não é suficiente). Se sim, a GPU foi conectada em uma única saída pci-e, em vez de duas.
É possível que a GPU tenha consumido mais do que o possível nesta entrada (40A, 480W) e queimou toda a PSU? Posso realmente aplicar o limite de potência de 250W?
Tags gpu cuda ubuntu power-supply