Você pode digitalizá-los e usar um software de OCR para obter os dados dos tickets, se eles estiverem claramente legíveis. O Typereader 2008 da expervision é um ótimo que eu pessoalmente usei antes. A Wikipedia oferece muitas informações sobre o assunto.
Quanto às fórmulas, é possível extrair a quantidade média e mediana de vezes que um número é representado em uma determinada sequência e intervalo de tempo e continuar fazendo alguns cálculos com ele.