Existe algum software que realiza uma análise textual em blogs? [fechadas]

8

Minha empresa está procurando criar uma visualização PivotViewer dos posts de um Wordpress 2 de um cliente nos últimos 11 anos. Para fazer isso, no entanto, precisamos editar as tags aleatórias, incompletas e geralmente ruins para uso como categorias classificáveis. Estou procurando uma ferramenta que analise suas entradas no blog e realize a contagem de palavras, para nos dar uma ideia do que estamos lidando.

O ideal seria ter todos esses recursos:

  1. Lista negra de palavras (ignorar)
  2. Word stemming
  3. Confusão de sinônimo personalizado
  4. Contando todos os usos
  5. Contando o número de postagens em que uma palavra aparece.
Eu teria pensado que esse tipo de análise textual seria extremamente comum, mas não consegui encontrar nenhum software que faça esse tipo de coisa em blogs inteiros. Existe software disponível para fazer isso?

    
por Brian Bauman 11.08.2011 / 16:38

6 respostas

3

O software que você está procurando pode ter muitos títulos, como "Análise de conteúdo" , " Nuvem de tags " ou" Meta Tags "e muito mais, como" análise de texto "e" mineração de texto ".

Existem muitas ferramentas de software para esses fins, gratuitas e comerciais.

Eu não tenho experiência pessoal com essas ferramentas, mas um bom lugar para começar é Text Analysis Ferramentas que lista dezenas dessas ferramentas, gratuitas e comerciais.

Outra lista é Análise de Texto, Mineração de Texto e Software de Recuperação de Informações .

    
por 15.08.2011 / 09:33
2

Dê uma olhada no Rapidminer ou Weka

Por ser um blog de clientes, você provavelmente tem acesso ao banco de dados. Faça o download de todos os artigos como texto simples e use um dos programas acima para lidar com as questões de processamento de linguagem natural (1,2,3 e 5).

O número de utilizações é difícil de automatizar de verdade, já que tem a ver com determinar automaticamente o significado das palavras usando o contexto.

    
por 21.08.2011 / 11:44
2

um dos softwares de análise mais conteúdo é o WordStat projetado pela Provalis Research

WordStat é um módulo de análise de texto para o QDA Miner ou o SimStat. O WordStat combina o método de análise de conteúdo usando a abordagem de dicionário e muitos algoritmos de exploração ou vários métodos de mineração de texto. O WordStat pode aplicar dicionários de categorização existentes a um novo corpus de texto. Também pode ser usado no desenvolvimento e validação de novos dicionários de categorização. Quando usado em conjunto com codificação manual, este módulo pode fornecer assistência para uma aplicação mais sistemática de regras de codificação, ajudar a descobrir diferenças no uso de palavras entre subgrupos de indivíduos e auxiliar na revisão de codificação existente usando tabelas KWIC (Keyword In Context). O WordStat é projetado especificamente para estudar informações textuais, como respostas a perguntas abertas, entrevistas, títulos, artigos de periódicos, discursos públicos, comunicações eletrônicas, etc.

link

    
por 21.11.2012 / 20:47
1

Você pode querer experimentar o Wolfram's Mathematica . Você terá que fazer alguma programação, mas todas as ferramentas que você precisa estão lá:

por 19.08.2011 / 14:42
0

Algumas dessas perguntas podem ser respondidas de maneira rápida e suja usando a Pesquisa do Google no seu blog (mais fácil se ela tiver seu próprio domínio).

    
por 19.08.2011 / 18:13
0

Zemanta faz análises e pode sugerir tags e links. É um plugin do wordpress também.

Único problema: como está atualmente, requer abertura manual, seleção e salvamento de cada postagem.

Existe um grande número de plugins de tags automáticas para o wordpress. Você deve procurar o localizador de plugins e tentar.

    
por 19.08.2011 / 19:39