Tente este add-on do niqqud, talvez algo tenha atrapalhado a maneira como você adicionou o niqqud.
Eu tenho um documento do Microsoft Word com hebraico, e algumas das marcas de vogais parecem estar separadas das letras que deveriam estar.
Exemplo:
Usandoum, determinei que as letras às quais isso estava acontecendo estavam sendo interpretadas como" Formulários de Apresentação Alfabética "em vez de letras hebraicas regulares. (No exemplo acima, o gimmel pontilhado tinha um valor unicode de U + FB32, em vez de U + 05D2 com U + 05BC).
Existe alguma maneira de converter tudo em caracteres unicode hebraicos padrão, para que as vogais sejam exibidas corretamente?
Obrigado!
Tente este add-on do niqqud, talvez algo tenha atrapalhado a maneira como você adicionou o niqqud.
Seu documento de teste parece exibir ok no Word 2007, mas quando copio e colo o texto dele para o editor do BabelPad , ele é exibido errado da mesma maneira que na sua foto. Quando uso o comando BabelPad Converter → Formulário de normalização → Para NFC, o display é corrigido.
Parece que o problema não é com caracteres pré-compostos como U + FB32 GIMEL DE CARTA HEBRAICA COM DAGESH como tal, mas em conjunção com uma marca de combinação adicional como U + 05B7 HEBREW POINT PATAH após ela. Alguns programas não podem lidar com essas combinações, mesmo que eles possam manipular um formulário totalmente decomposto (letra base seguida por duas marcas de combinação).
É impossível (e provavelmente irrelevante) saber como as combinações de caracteres entraram no arquivo. Eles são dados Unicode válidos, mas não normalizados, e a normalização presumivelmente resolveria o problema. Parece que você poderia realmente usar qualquer um dos formulários de normalização Unicode aqui, mas o NFC geralmente é favorecido por razões gerais.
Até onde eu sei, o Word não tem ferramentas para normalização, então você precisaria usar ferramentas externas para isso. O BabelPad seria adequado para texto sem formatação, mas eu não sei o quão bem ele lida com arquivos grandes, e você provavelmente tem alguma formatação que precisa preservar. Portanto, talvez você possa salvar o arquivo como HTML, normalizar os dados para NFC no BabelPad e, em seguida, abrir o arquivo HTML modificado no Word. (Primeiro pensei em usar RTF em vez de HTML, mas o Word parece gerar RTF que não contém os caracteres hebraicos reais, mas algumas notações de escape.)
Eu não consegui isso como um comentário, então vou enviá-lo como uma resposta. Com base na sugestão do @Jukka K. Korpela, compus uma macro do Word que converte os caracteres pré-compostos em caracteres 'normais'. Ele pode ser baixado aqui .
Tags unicode hebrew microsoft-word