Estou preservando um manuscrito escrito por meu pai. Os arquivos de dados estão em disquete 5.25 ". Eu li com sucesso os arquivos fora dos discos, mas nenhum de nós sabe o formato da linguagem de marcação. É usado por editores de livros no início dos anos 90.
Aqui estão algumas linhas de um dos arquivos.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Alguém pode identificar a linguagem de marcação usada aqui?
Eu tenho esses dois arquivos originais e o livro publicado. Não seria muito difícil para mim descobrir o que significam os códigos. Mas se o formato puder ser identificado, algum tipo de tradutor automático para algo mais recente (RTF, XML, etc.) pode estar disponível.
Editar
É como um mistério a ser resolvido! Veja como uma tabela é iniciada:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Eu pesquisei alguns termos como begtab
e setbgut
. Este último criou um documento em PDF que parece ter um "erro de digitação", mas o erro de digitação é uma tag setbgut
quase exatamente igual à dos meus arquivos.
link (pesquise setbgut
)
Parece que este trabalho de pesquisa foi apresentado usando o mesmo software. Eu o trouxe para o Acrobat e as propriedades dizem que ele foi gerado pelo Xyvision Parlance Publisher (XPP). Aqui está o melhor que eu encontrei sobre eles até agora: link
Editar 2
OK, vejo agora. O XPP é uma linguagem de marcação semelhante ao SGML. De fato, a literatura de vendas do XPP anuncia como é "fácil" pegar um documento SGML existente e adicionar suas marcas proprietárias. Infelizmente, o XPP foi vendido para a General Dynamics há alguns anos. Traduzir o documento automaticamente para, digamos, HTML é difícil sem o DTD. No entanto, como outros apontaram, a maioria das tags é fácil de descobrir. Alguns deles, como as referências bibliográficas e os valores após o ponto-e-vírgula em tags como <rrh;1>
e <lp;&-1q>
, ainda me escapam. Vou ter que comparar o arquivo com a cópia física, lado a lado, para decodificá-lo.