Na verdade, para cargas realmente quentes , isso pode ter um impacto significativo. Se você olhar para a Anatomia de um registro você verá que as colunas seguem o cabeçalho do registro, a coluna fixa primeiro seguida pelas de comprimento variável. Portanto, sempre que uma coluna é acessada, o cabeçalho do registro terá que ser acessado primeiro e esse acesso é quase sempre um erro de cache L2. Qualquer acesso subseqüente dentro da mesma linha de cache (64 bytes) será um cache L2 atingido quase 100% das vezes. Dado que a diferença no ciclo da CPU entre um erro de cache L2 e um acerto é de aproximadamente 2 ordens de magnitude, você obtém um grande aumento de desempenho se organizar as colunas acessadas com frequência perto do cabeçalho do registro. O aumento de desempenho de ponta a ponta não será em qualquer lugar 2 ordens de grandeza, mas para certas cargas OLTP pode adicionar até 5-10% no total. Para cargas analíticas, o custo de IO sobrecarrega todo o resto e você provavelmente não será capaz de medir qualquer diferença.
Essa lógica é aplicada a todos os índices individualmente, mas em índices você deve considerar que a ordem de declarar o índice é a ordem real da chave para que você não tenha muito espaço para mudanças .