Adicionando softhyphens ao HTML a partir da linha de comando

2

Estou procurando uma maneira de inserir automaticamente hífens flexíveis ( ­ ou caractere unicode) para hifenizar palavras em um documento HTML a partir da linha de comando.

1) Qual é a melhor maneira de fazer isso a partir da linha de comando?

2) Quais são as opções de uso de diferentes dicionários / regras para a hifenização de palavras? Existem regras para outros idiomas além do inglês?

Estou ciente de que alguns softwares, incluindo o LibreOffice como descrito em Software de hifenização automática , têm a opção de aplicar hifenização ao documento, mas estou procurando uma maneira de fazê-lo no documento HTML já existente sem usar o software de processamento de texto.

    
por Rafal 07.10.2013 / 11:50

1 resposta

1

Se o que você está procurando é simplesmente substituir - por ­ , basta usar sed :

sed -i 's/-/\­/g' file.html

O comando acima irá editar file.html e fazer a substituição desejada.

Sua outra pergunta não está no tópico aqui, então não vou aprofundar, mas sim, idiomas diferentes geralmente têm regras de hifenização diferentes.

    
por terdon 17.03.2014 / 02:19