Uma pergunta terrivelmente antiga que repentinamente brilhou no frontpage de novo ...: -)
So my question is: What are others currently doing to create a scalable (a few 100TBs) file storage system over Amazon EC2 without using Amazon S3 thats redundant?
Nada, na AWS, você usaria o S3 para armazenamento de BLOB de 100 TB, qualquer outra coisa seria sem sentido.
We need to transfer these files over HTTPS using a CNAME. This is obviously impossible with Amazon S3 for many technical reasons.
É verdade, mas é possível por outros meios.
Como você precisa de acesso HTTPS em seu próprio nome de domínio, você configuraria alguns servidores HTTPS (ou proxies) nos nós do EC2, para agir como gateways de criptografia / descriptografia SSL entre a Internet e o S3.
Eu nunca trabalhei com o Servidor de Tráfego Apache (anteriormente Inktomi), mas parece um ótimo ajuste para isso. Caso contrário, o nginx ou o Apache podem ser usados para o manuseio de SSL, juntamente com o Squid ou o Varnish, se você quiser fazer cache.
Em alto nível, a solicitação-resposta é algo assim:
Internet request via https -->
(optional) Elastic Load Balancing -->
EC2 instance with SSL capable HTTP proxy (fx nginx) -->
plain unencrypted http to S3
Além disso, você precisará de uma maneira determinística de lidar com a regravação de URL. Fx https://secure.yourdomain.com/<id>
é reescrito para http://<bucket>.s3.amazonaws.com/<id>