Mineração de Textos no R

João Marcos

13 de junho de 2016

Mineração de Textos

Mineração de textos (Text Mining) é um Processo de Descoberta de Conhecimento, que utiliza técnicas de análise e extração de dados a partir de textos, frases ou apenas palavras.

Tipos de Texto

Os dados estruturados são organizados em linhas e colunas, geralmente são encontrados em banco de dados relacionais, são eficientes quanto à recuperação e processamento.

Os dados não estruturados referem-se a dados que não podem ser organizados em linhas e colunas, como vídeos, comentários em redes sociais e e-mails, entre outros.

Termo Big Data

É termo que descreve o imenso volume de dados – estruturados e não estruturados – que impactam os negócios no dia a dia. Mas o importante não é a quantidade de dados.

imagem ilustrativa

Aplicações Tipicas de Text Mining

Estrutura

A ideia para se trabalhar com os dados em texto.

Banco de dados

Softwares para Mineração de Textos

Exemplo 1

Pronunciamento dos deputados federais antes da votação.