Existe alguma maneira de adicionar uma nova localização à lista de locais onde o nltk procura o wordnet corpus?

6

Não consigo usar o lematizador wordnet do nltk porque não consigo fazer o download do corpus wordnet em meu computador da universidade devido a problemas de direitos de acesso.

Eu recebo o seguinte erro quando tento fazer isso:

**********************************************************************   
Resource 'corpora/wordnet' not found. Please use the NLTK Downloader
to obtain the resource: >>> nltk.download() Searched in:
    - '/home/XX/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

Quando tive o mesmo problema em casa, consegui resolvê-lo de duas maneiras:

  1. Usando nltk.download() , o caminho padrão e
  2. Criando uma nova pasta no local /home/XX/nltk_data e apenas colando o diretório de corpus nela.

Agora, na universidade, só tenho acesso a /home/XX/bin e não /home/XX diretamente. Então, existe alguma maneira que eu poderia colar o corpus wordnet em /home/XX/bin e, de alguma forma, fazer o nltk procurar pelo corpus naquela pasta?

    
por Programming Noob 01.11.2012 / 05:25

2 respostas

6

import nltk;

Agora, nltk.data.path é uma lista de locais onde procurar os módulos. Você pode apenas fazer:

nltk.data.path.append("your location/directory");
    
por Javesh 01.07.2014 / 16:22
4

Parece que você precisa definir a variável de ambiente "NLTK_DATA" para informar ao NLTK onde procurar. link

    
por Harrison 08.11.2012 / 04:54

Tags