Como posso descobrir a entrada mais longa em um dicionário?

1

Perguntei no English Stack Exchange, "Qual é o Inglês palavra com a mais longa definição única? " A melhor resposta que eles poderiam dar é que eu precisaria de um programa que poderia descobrir a entrada mais longa em um arquivo de texto (listando) dicionário definições, contando a quantidade de caracteres ou palavras em uma determinada entrada e, em seguida, fornecer uma lista das entradas mais longas.

Consegui encontrar um arquivo de dicionário que convertido em texto tem o seguinte formato:

a /a/ indefinite article (an before a vowel) 1 any, some, one (have a cookie). 2 one single thing (there’s not a store for miles). 3 per, for each (take this twice a day).

aardvark /ard-vark/ n an African mammal with a long snout that feeds on ants.

abacus /a-ba-kus, a-ba-kus/ n a counting frame with beads.

Como você pode ver, cada definição vem depois da pronúncia (incluída por barras) e, em seguida:

1) termina com um período ou

2) termina antes de um exemplo (entre parênteses), ou

3) segue um número e termina com um período ou antes de um exemplo, quando uma palavra tem várias definições.

O que eu precisaria, então, é uma função ou programa que possa distinguir cada definição (incluindo considerar múltiplas definições de uma única palavra como separadas), então contar a quantidade de caracteres e / ou palavras dentro dela (ignorando os exemplos em parênteses, já que essa não é a definição correta) e, finalmente, fornecer uma lista das definições mais longas (acho que não precisaria de mais do que um top 20 ou mais para comparar). Se o formato do arquivo foi um problema, eu posso converter o arquivo para PDF, EPUB, etc. sem nenhum problema. E, eu acho que idealmente eu gostaria de poder escolher entre contar o comprimento por caracteres e por palavras, se fosse possível.

Como devo fazer isso? Agradecemos antecipadamente.

    
por Cesar 20.11.2017 / 00:15

0 respostas