Por que uma placa Geforce executa 4x mais lenta em precisão dupla do que uma placa Tesla?

1

Eu vi isso mencionado em vários lugares. Da Wikipedia:

For equivalent single precision output, Fermi-based nVidia Geforce cards have four times less dual-precision performance [than Tesla cards].

Eu ouvi explicações vagas envolvendo um "multiplicador". Envolve algo fisicamente incapacitado no equivalente Geforce morre?

    
por Peter Becich 06.02.2012 / 09:42

1 resposta

3

É a diferença entre ter operações de precisão dupla implementadas em hardware e ter que fazer uma operação de dupla precisão como quatro operações de precisão única.

Por exemplo, considere a multiplicação de "16" por "43". Se você tivesse um multiplicador nativo de dois dígitos, faria isso em uma operação. Se você tivesse apenas um multiplicador de dígito único, teria que multiplicar 1 por 4, 1 por 3, 6 por 4 e 6 por 3, para fazer isso. Assim:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

Observe que você precisa fazer multiplicações de um único dígito em 4 para fazer uma multiplicação de dois dígitos, então leva quatro vezes mais tempo. Portanto, se você não tiver um multiplicador de precisão dupla, mas tiver apenas um, ele levará quatro vezes mais tempo para fazer uma multiplicação de precisão dupla.

    
por 06.02.2012 / 11:02