O texto de zpool status
é um pouco enganador. Um erro permanente (neste contexto) indica que ocorreu um erro de E / S e foi registrado no log de erros do SPA (Storage Pool Allocator) para esse pool. Isto não significa necessariamente que há corrupção de dados irrecuperável.
O que você deve fazer é executar um zpool scrub
no pool. Quando o scrub estiver concluído, o log de erros do SPA será girado e não mostrará mais erros antes do scrub. Se o scrub não detectar erros, então zpool status
não mostrará mais erros "permanentes".
Em relação à documentação, está dizendo que apenas "erros fatais" são registrados desta forma. Um erro fatal é um erro de E / S que não pode ser corrigido automaticamente pelo ZFS e, portanto, foi exposto a um aplicativo como E / S com falha. Por outro lado, se a E / S fosse repetida com êxito ou se a E / S lógica fosse satisfeita a partir de um dispositivo redundante, ela não seria considerada um erro fatal e, portanto, não seria registrada como um erro de corrupção de dados.
Um erro fatal não significa necessariamente perda permanente de dados, apenas significa que no momento em que não pôde ser corrigido antes de ser propagado para o aplicativo. Por exemplo, um cabo solto ou um controlador ruim pode causar erros fatais temporários que o ZFS descreveria como "permanentes". Se realmente é um problema depende da natureza da E / S e se o aplicativo é capaz de se recuperar de erros de E / S.
EDIT: Concordo plenamente com @bahamat que você deve investir em redundância o mais rápido possível.