Eu tenho um disco virtual em um estado cronicamente insalubre, mas funcional depois que uma unidade com falha foi substituída há algum tempo. O comando de reparo retorna instantaneamente neste VD e o status de saúde não indica exatamente o que está errado com ele, então eu ignorei o aviso.
Recentemente, desconectei uma unidade de trabalho dessa matriz por engano e a reinstalei algumas horas depois (as duas ações envolveram a energização do servidor). Quando o servidor voltou, todos os VDs no pool estavam trabalhando separados dessa paridade VD. Está marcado como IsManualAttach=true
e, uma vez anexado, o sistema de arquivos é mostrado como RAW. Eu usei um software undelete para verificar o conteúdo e notei grandes blocos de zeros na maioria dos arquivos.
Minha teoria é de que houve alguns corrupções nos metadados ou algum bug que desativou uma coluna no RAID 5 e impediu que ela fosse consertada. Quando a segunda unidade foi puxada, outra coluna foi desativada, mas isso não foi corretamente tratado pelo código de nível superior que realmente apresenta os VDs para o sistema operacional.
Minha pergunta é alguém já viu isso antes? Existe alguma ferramenta que me permita ver e manipular os metadados de baixo nível em espaços de armazenamento?
Mais informações:
Eu só recentemente descobri que esses eventos foram registrados sobre este VD por meses (em Microsoft-Windows-StorageSpaces-Driver / Operational):
(Event Id 303) Drives hosting data for virtual disk
{b731f6a8-b99f-11e4-811f-000c29404dab} have failed or are missing. As
a result, no copy of data is available. Return Code: This device does
not exist.
(Event Id 304) The virtual disk {b731f6a8-b99f-11e4-811f-000c29404dab} is in a
degraded state. This can happen when a physical disk hosting the
virtual disk fails, is disconnected, or experiences a write error.
Windows will attempt to repair the virtual disk. No action is needed at this time.
(Event Id 306) The attempt to map, or allocate more storage for, the
virtual disk {b731f6a8-b99f-11e4-811f-000c29404dab} has failed. This
is because there was a write failure involved in the updating the
virtual disk metadata. Return Code: The physical resources of this
disk have been exhausted.
PS C:\Windows\System32> Get-VirtualDisk Redundant | fl
ObjectId : {1}...
PassThroughClass :
PassThroughIds :
PassThroughNamespace :
PassThroughServer :
UniqueId : A8F631B79FB9E411811F000C29404DAB
Access : Read/Write
AllocatedSize : 4626485084160
DetachedReason : None
FootprintOnPool : 6168646778880
FriendlyName : Redundant
HealthStatus : Healthy
Interleave : 262144
IsDeduplicationEnabled : False
IsEnclosureAware : False
IsManualAttach : True
IsSnapshot : False
LogicalSectorSize : 4096
Name :
NameFormat :
NumberOfAvailableCopies :
NumberOfColumns : 4
NumberOfDataCopies : 1
OperationalStatus : OK
OtherOperationalStatusDescription :
OtherUsageDescription :
ParityLayout : Rotated Parity
PhysicalDiskRedundancy : 1
PhysicalSectorSize : 4096
ProvisioningType : Thin
RequestNoSinglePointOfFailure : False
ResiliencySettingName : Parity
Size : 5497826574336
UniqueIdFormat : Vendor Specific
UniqueIdFormatDescription :
Usage : Other
WriteCacheSize : 33554432
PSComputerName :