Desduplicação de dados do servidor 2012 ignorando VHDs de réplica

1

Atualmente, estou tentando usar a deduplicação de dados em dois hosts Hyper-v separados do Windows Server 2012 Datacenter Edition. Em um deles, estou tentando deduzir réplicas que ainda estão sendo ressincronizadas a cada 5 minutos. Por outro lado, parei o resync com um script do powershell em cerca de 15 servidores (4 terabytes de dados) e movi-os para a raiz do volume que eu aplicei no ativado.

Agora, por algum motivo, funciona com qualquer coisa que eu incluo, exceto imagens de VHD de réplica. Apenas os ignora.

Eu coloquei 50 GB de modelos e isos e funcionou muito bem, eu iniciei a deduplicação da seguinte forma:

Start-DedupeJob -Full -Path R: -Type Optimization

Funciona normalmente, mas o motivo real pelo qual estou usando é reduzir o espaço necessário para armazenar um instantâneo da réplica do VHD. Eu preferiria poder fazer com que o host do hyper-v sincronizasse novamente os VHDs e fizesse a desduplicação, mas se eu tiver que remover a sincronização e, em seguida, desduplicar e, em seguida, desatualizar para ressincronizar ou algo que está bem para mim, fora, mas agora em nenhuma circunstância posso obter estes para dedupe a réplica vhds !!! Está me deixando louco!

Qualquer conselho, sugestões, seria muito apreciado.

ATUALIZAÇÃO:

Eu tenho dois VHDs, um é de um modelo e o outro é uma imagem de réplica de uma unidade de dados de 1,6 terabyte em outra VM em outro host do servidor Hyper-V.

Combinei todas as propriedades e permissões do arquivo como idênticas, incluindo propriedade. A única coisa é que o arquivo que funciona com deduping é marcado como Attribute APL e o que não está fazendo é apenas Attribute A - não tenho certeza do que P e L são e não acredito que possa configurá-lo com attrib .exe.

Tão louco - nenhuma réplica vhds irá deduzir o que acontece!

ATUALIZAÇÃO:

O script que estou usando para otimizar o vhds é

$vhds = Get-ChildItem -Recurse | ? {$_.extension -match "vhd"}

foreach ($vhd in $vhds) {

Mount-VHD -Path $vhd.fullname -Verbose -ReadOnly

Optimize-VHD -path $vhd.fullname -Verbose -Mode Retrim

Dismount-VHD -path $vhd.fullname -Verbose

}

Eu corri isso e notei que está demorando um pouco mais para o processo de desduplicação terminar, mas ainda não há desduplicação acontecendo com os VHDs de replicação. Isso é muito estranho para mim - eu estava esperando que se algo estivesse sinalizando o arquivo como 'aberto', ele não faria mais assim depois que o optimize-vhd fosse executado. Os VHDs em questão não foram gravados por algum tempo agora. Eu usei esse script para desativar a ressincronização no host para interromper as gravações:

$vmlist = get-vm * | where {$_.replicationstate -eq "replicating" -and $_.state -eq     "Running"}

foreach ($vm in $vmlist) {

$vmname = $vm.name
set-vmreplication -vmname $vmname -AutoResynchronizeEnabled $false

}
    
por Matt Wall 23.11.2012 / 19:11

2 respostas

2

Eu suspeito que seus VHDs de réplica estejam constantemente abertos com um bloqueio de gravação ou com muita frequência gravados para serem cobertos pela configuração de MinimumFileAgeDays (5 dias por padrão, pode ser definido como 0 com Set-Dedupvolume <Drive>: -MinimumFileAgeDays 0 ).

A propósito, a documentação declara claramente tal configuração "não suportada":

Unsupported configurations

Constantly open or changing files

Deduplication is not supported for files that are open and constantly changing for extended periods of time or that have high I/O requirements, for example, running virtual machines on a Hyper-V host, live SQL Server databases, or active VDI sessions.

Deduplication can be set to process files that are 0 days old and the system will continue to function as expected, but it will not process files that are exclusively open. It is not a good use of server resources to deduplicate a file that is constantly being written to, or will be written to in the near future. If you adjust the default minimum file age setting to 0, test that deduplication is not constantly being undone by changes to the data.

Deduplication will not process files that are constantly and exclusively open for write operations. This means that you will not get any deduplication savings unless the file is closed when an optimization job attempts to process a file that meets your selected deduplication policy settings.

E, portanto, também contém a seguinte recomendação:

Not good candidates for deduplication:

  • Hyper-V hosts
  • VDI VHDs
  • WSUS
  • Servers running SQL Server or Exchange Server
  • Files approaching or larger than, 1 TB in size

Parece um pouco com o que você está procurando é a desduplicação on-line que deduz os dados conforme eles são gravados no disco. Este é um recurso de algumas soluções SAN mais sofisticadas (incluindo ofertas direcionadas para SMB da Nexenta), mas tem um custo bastante alto para o silício - você precisaria de uma máquina poderosa com um lote de RAM para ter dedup on-line executado sem problemas.

    
por 24.11.2012 / 00:23
2

Eu tenho o mesmo problema. A partir da leitura deste blog, os atributos que você mencionou me enviaram para o seguinte site da MS ....... O atributo stupid reparsing faz o dedup pular a réplica do vhds.

A desduplicação ignora os seguintes arquivos:

Arquivos de estado do sistema

Arquivos criptografados

Arquivos com atributos estendidos

Arquivos cujo tamanho é menor que 32 KB

Pontos de nova análise (que não são pontos de nova análise de desduplicação de dados)

link

    
por 17.01.2013 / 08:59