I would prefer to keep the system running (and tolerate some FS errors)
Esta é uma contradição em termos. Quando você obtiver erros de FS, seu sistema não estará em execução por muito tempo. De fato, rodar com errors=continue
é muito mais provável de danificar ainda mais um sistema de arquivos corrompido até que não haja nenhuma esperança de recuperação sensata.
Se você quiser que seu aplicativo faça uma melhor tentativa de continuar a operação mesmo se houver erros de FS, ele deverá ter um script que detecte quando /
foi somente leitura e reinicialize com um fsck forçado.
Em algum momento, tudo acaba. É a lei do aumento da entropia. Não há nada que você possa fazer a respeito, além de aderir a princípios sólidos de engenharia e obter peças de alta qualidade para casos de uso crítico.