Perguntei no English Stack Exchange, "Qual é o Inglês palavra com a mais longa definição única? " A melhor resposta que eles poderiam dar é que eu precisaria de um programa que poderia descobrir a entrada mais longa em um arquivo de texto (listando) dicionário definições, contando a quantidade de caracteres ou palavras em uma determinada entrada e, em seguida, fornecer uma lista das entradas mais longas.
Consegui encontrar um arquivo de dicionário que convertido em texto tem o seguinte formato:
a /a/ indefinite article (an before a vowel) 1 any, some, one (have a cookie). 2 one single thing (there’s not a store for miles). 3 per, for each (take this twice a day).
aardvark /ard-vark/ n an African mammal with a long snout that feeds on ants.
abacus /a-ba-kus, a-ba-kus/ n a counting frame with beads.
Como você pode ver, cada definição vem depois da pronúncia (incluída por barras) e, em seguida:
1) termina com um período ou
2) termina antes de um exemplo (entre parênteses), ou
3) segue um número e termina com um período ou antes de um exemplo, quando uma palavra tem várias definições.
O que eu precisaria, então, é uma função ou programa que possa distinguir cada definição (incluindo considerar múltiplas definições de uma única palavra como separadas), então contar a quantidade de caracteres e / ou palavras dentro dela (ignorando os exemplos em parênteses, já que essa não é a definição correta) e, finalmente, fornecer uma lista das definições mais longas (acho que não precisaria de mais do que um top 20 ou mais para comparar). Se o formato do arquivo foi um problema, eu posso converter o arquivo para PDF, EPUB, etc. sem nenhum problema. E, eu acho que idealmente eu gostaria de poder escolher entre contar o comprimento por caracteres e por palavras, se fosse possível.Como devo fazer isso? Agradecemos antecipadamente.
Tags dictionary word-count