shell script para encontrar a frase substantiva unix

1

uma entrada no banco de dados on é:

LPE-1*story#1/1 of pearl#1/2*historia de la perla*storia della perla* histoire de la perle* história da pérola*istoria perlei*TOPIC

Os campos são separados por estrelas, *. Eles são:

sentence ID|English NP|Spanish translation|Italian translation|French translation|Portuguese translation|Romanian translation|Semantic relation

O campo Inglês NP tem o seguinte formato:

noun1#sense/i [preposition] noun2#sense/j

onde i e j podem ser 1 ou 2 indicando a posição do argumento semântico na instância NP (note que a preposição pode estar faltando). Por exemplo, na cadeira de instância NP # 1/2 arm # 1/1, que codifica uma relação parte-todo (PW), o substantivo chair indica o todo (e, portanto, é rotulado como 2), e o substantivo arm codifica a parte (e é rotulado como 1).

Problema:

Escreva um script de shell contendo uma combinação de comandos UNIX e AWK que dará a resposta às seguintes perguntas. O script de shell deve ser executado apenas uma vez e gerado (para saída padrão, a menos que seja mencionado de outra forma):

  1. o número de instâncias NP inglesas no arquivo;
  2. o número de NPs ingleses únicos (considere para isso o campo inteiro $ 2);
  3. a lista de relações semânticas únicas consideradas neste banco de dados (armazene-o em "sr.uniq.txt");
  4. a frequência de cada relação semântica no banco de dados com o seguinte formato: Freqüência de releitura semântica (armazene isso em "sr-freq.txt");

Como fazer para a pergunta 2,3,4

    
por uk2yere 11.10.2013 / 06:34

0 respostas