Would Gluster help me with I/O limits of harddrives, if I chained a lot of machines together?
Se assim fosse, substituiria isso por ... limites de rede. Quero dizer, seriamente - se você distribuir IO em mais de 50 máquinas, sua rede precisa lidar com isso. Se você se deparar com limites de IO, não apenas limites de área de armazenamento (ou seja, terabyte), a solução adequada é investir em uma solução focada em IO. Não é como se eles não existissem.
Can "Gluster" serve FLV files without any front-end server layers just using the built-in HTTP protocol ?
Nenhum protocolo de arquivo é exibido por HTTP;)
Eu vejo o Gluster como um sistema de tamanho médio / armazenamento orientado. Sim, você ganha espaço e isso sem muita administração, e sim, você pode usar máquinas baratas - como colocar grandes discos rígidos em cada estação de trabalho e usá-los como arquivos tipo de coisa do servidor.
Mas se você obtiver LARGE (youtube) você ainda pode precisar de sistemas dedicados (mesmo que eles executem o Gluster), e se você executar um monte de IO, então um estilo SAN de infraestrutura com cluster de conteúdo servindo front ends (ou seja, particionando o arquivos para que nem todo servidor tenha que armazenar tudo em cache) é logicamente a única solução. Gluster é inteligente, não pode fazer mágica. O armazenamento em cache no servidor de exibição real pode estar sobrecarregado.
A movimentação de E / S dos discos para a rede resulta em muitos requisitos muito altos para a rede. Você pode querer ler o Infiniband - ele é mencionado nos documentos do Gluster. Mas dito isso, qual é o problema com os limites de IO, se um controlador RAID barato (faixa de US $ 1.000) pode lidar com cerca de 200 discos SATA? Você não precisa de muitas máquinas (com custos mais altos) para contornar os limites de IO. Isso sempre será mais caro que caixas dedicadas (obviamente, você tem que pagar por mais CPU, mais RAM etc.). E você não salvará discos com o Gluster - é necessário um armazenamento de dados totalmente redundante nos dois casos, com e sem o Gluster.
Dito isto, o uso de servidores front-end é aconselhável por muitas razões. Mesmo que o Gluster consiga lidar com isso, em uma instalação grande, seria totalmente estúpido não usar servidores front-end separados, de preferência com algum firewall no meio.