Como garantir a mesma velocidade dos discos rígidos entre as máquinas de cluster?

0

Eu executo experimentos em máquinas de cluster. Cada máquina tem exatamente o mesmo hardware & configurações de software.

O tempo de execução dos experimentos depende da velocidade de leitura seqüencial do HDD (100% de tarefas vinculadas ao disco io).

descobri que

  1. mesmo que cada máquina tenha os mesmos bytes de dados, seu tempo de execução varia muito (1,3 a 1,8 vezes entre o mais rápido e o mais lento).
  2. para cada execução com o arquivo de dados diferente, as máquinas mais lentas e mais rápidas mudam. Mas, para o mesmo arquivo de dados, os resultados são repetíveis.
  3. quando executo os mesmos experimentos com SSD, os problemas acabaram. A maioria das máquinas termina quase ao mesmo tempo.

Realizei experimentos que apenas lêem os arquivos de dados armazenados nos discos das máquinas (usando a ferramenta de benchmark de disco 'fio'). Os resultados são os mesmos.

Minha teoria é que quando o arquivo de dados é armazenado em discos rígidos em cada máquina, eles são armazenados nos diferentes setores do disco. A parte externa dos cilindros de disco pode ter a maior velocidade de varredura sequencial do que a parte interna deles. ( link , link )

Existe alguma maneira de ajustar as diferentes velocidades de leitura de disco, de modo que eu possa realizar as experiências com as velocidades de disco uniformes?

    
por syko 26.06.2017 / 12:23

0 respostas

Tags