Como criar o TMX a partir de arquivos TXT existentes

1

Eu tenho alguns livros em formato impresso. Eles foram traduzidos do inglês para o norueguês antes dos computadores serem mainstream, então eu corri a tradução através de um scanner e o fiz com o OCR. A versão em inglês já foi digitalizada.

Existem erros de OCR que preciso corrigir e também preciso corresponder os parágrafos da tradução norueguesa ao original em inglês.

Parece que eu deveria usar algum programa de Memória de Tradução como o Zanata como ferramenta e repositório para as traduções, mas antes que eu possa fazer isso eu preciso criar um arquivo TMX que corresponda aos segmentos entre as traduções existentes

Alguma ideia de como posso fazer isso? Ou eu estou atacando esse problema no ângulo errado?

    
por nitech 16.12.2015 / 18:50

1 resposta

0

Se você procurar por "Align Translations", encontrará algumas ferramentas que são designet especificamente para alinhar parágrafos (ou sentenças) em documentos já traduzidos.

Eu usei sourceforge.net/projects/aligner , que é uma plataforma cruzada. Eu não estou muito impressionado com a ferramenta, mas faz o trabalho, na medida em que a pergunta acima vai (ele permite alinhar o texto e, em seguida, produz um arquivo TMX)

No entanto, acabei deixando a ferramenta por um motivo que não está claro na pergunta acima. Eu precisava do alinhador para produzir um arquivo de texto que correspondesse exatamente ao original, com relação ao número de quebras de linha. Embora o LF Aligner armazene um projeto em andamento em arquivos de texto, houve alguns problemas:

  • Quando abri um projeto pela segunda vez, alguns dos alinhamentos estavam confusos. Especificamente, isso dizia respeito a lugares que eu adicionei um parágrafo vazio.
  • Problemas gerais no manuseio de parágrafos vazios no idioma original e na tradução.

Adicionaremos mais informações a esta postagem se encontrar uma ferramenta capaz de fazer isso.

    
por 22.12.2015 / 08:59