Muitas vezes, quando estou trabalhando com grandes conjuntos de dados, eu estruturo os dados de uma maneira em que cada linha é igual a um caso específico. Por exemplo, em um experimento psicológico, eu insiro os dados para que todos os pontos de dados na mesma linha sejam do mesmo participante.
No entanto, em todos os softwares de planilhas que experimentei (Excel, Open Office, Libre Office, Google Docs, etc.), é possível classificar dados para um subconjunto estrito das colunas, deixando os pontos de dados não pertencentes a este subconjunto estacionário. Se você está trabalhando com um conjunto de dados em que cada linha representa um caso específico, esses tipos de operações podem ser potencialmente devastadores.
Agora, pode-se argumentar que a melhor coisa a fazer aqui é evitar o uso desses tipos de funções de classificação, aplicando apenas funções globais de classificação. No entanto, o fato de essas funções de classificação ainda existirem resulta em não confiar totalmente nos meus dados e, às vezes, aconteceu de aplicá-los ao meu conjunto de dados por acidente (às vezes nem percebi).
Compare isso com um programa como, por exemplo, o SPSS. Aqui, a filosofia "uma linha = um caso" é incorporada ao próprio programa, o que significa que você não pode estragar aplicando a função de ordenação errada.
Então, minha pergunta é: os programas de planilhas são inerentemente inadequados para dados de "uma linha = um caso"? Existe alguma maneira, em qualquer um dos programas que eu listei acima, para bloquear os dados para sua linha, ou desativar as funções de classificação que poderiam estragar tudo?