My question is, if I purchase a standard Windows external hard drive with a USB connection, will I be able to copy the files from the Linux cluster's files server to the external drive?
Sim, não há problema técnico para isso, no entanto:
O hardware não é um disco rígido "padrão windows com conexão USB". Por favor, descarte a parte do Windows dessa frase. E o HDD USB externo funciona igualmente bem com ou sem o Windows como SO.
I am assuming that the Linux cluster has a USB port, but this is something that I will need to verify.
Para uma grande quantidade de dados (e 1TB é muito), conectar a unidade localmente é provavelmente muito mais rápido. No entanto, com USB2 você ainda está limitado a 35-ish MB / seg. Isso significa que a cópia de 1 TB em USB2 leva de 8 a 9 horas. *
Você pode acelerar bastante se a unidade estiver montada localmente (via SATA simples), se o cluster e sua unidade tiverem eSATA, se ambos tiverem USB3 ou se ambos tiverem firewire.
Como alternativa, você pode conectar a unidade à sua própria área de trabalho e copiar os arquivos. Neste caso, a rede pode ser o limite de velocidade. Você também corre o risco de um administrador irritado perguntar por que você está tornando a rede tão lenta para outros usuários. : -)
It looks like many standard Windows external hard drives are formatted in either NTFS or FAT32, whereas our Ubuntu Linux file server uses NFS.
uhm, não.
O disco rígido não se importa com qual sistema de arquivos é usado. Ele pode vir pré-formatado com o NTFS (que é uma escolha sensata para a maioria das pessoas que os compram), mas nada impede que você altere o sistema de arquivos e a reformatação. Isso deve levar apenas alguns minutos.
Além disso, o servidor de arquivos não usa o NFS em seus discos rígidos. Provavelmente está usando ext2, ext4 ou ZFS. Nenhum dos quais você precisa se preocupar. Contanto que você possa ler os dados, pode escrevê-los em qualquer formato.
(Considere a analogia: Você copia o texto escrito em um caderno. Não se preocupe com a forma ou a cor do caderno original. Desde que você possa ler e ter um caderno grande o suficiente, você pode copiar o conteúdo de um caderno para outro).
* : 8-9 horas estimadas com base nisso:
35 MiB / segundo
100 MiB por 3 segundos.
1000 MiB por 30 segundos, o que é o mesmo que 1GiB por 30 segundos.
1GiB por 30 segundos
1000GiB por 30000 segundos
1 TB por 30000 segundos. 30000/3600 = 8,3 (3600 segundos por hora)