Minería de Texto, una técnica para analizar la Web

Uso de la “Minería de texto” para analizar los contenidos de la Web y otras fuentes con contenidos “no estructurados”.


La información que tienen a su disposición las empresas, proviene de diversos orígenes y tienen variados formatos, se estima que cerca del 70% de estos datos son “no estructurados”, es decir, no obedecen a estándares informáticos que facilitan su tratamiento.  Esta información, que se expresa en el leguaje natural, el que todos empleamos, esta contenida en documentos, mensajes de correo electrónico, páginas Web, feeds de RSS (de blogs y noticias), notas de servicio, encuestas, reclamos, curriculums, registros de llamadas, etc.

No tomar en cuenta esta información, sería como negarse a ver gran parte del panorama que tenemos a nuestra disposición.  Para facilitar el análisis de estas fuentes de datos, contamos con la Minería de Texto (Text Mining) que utilizando técnicas de Procesamiento del Lenguaje Natural (NLP), permite transformar toda esta información en formatos estructurados o semi-estructurados que van a facilitar las tareas del análisis e interpretación de la información.

Contando con información estructurada, se podrá hacer uso de las técnicas de Minería de Datos (Data Mining), algo más conocido, para facilitar el descubrimiento de patrones, tendencias, desviaciones y detectar asociaciones entre nuestros objetos de estudio.

Software Mineria Texto

Existe software que permite las tareas de minería de texto, quizás por el tiempo que llevan en el mercado de la “Inteligencia empresarial” (Business Intelligence) los más reconocidos son el de SAS y SPSS.

 http://www.sas.com/technologies/analytics/datamining/textminer/index.html#section=1

http://www.spss.com/software/modeling/text-analytics/

 Ag.

Autor: anibal goicochea

anibal goicochea mendo Formador y Consultor Informático, especialista en Business Intelligence, Planificación, Presupuestos, Consolidación Financiera y Datawarehousing con soluciones basadas en SAP BW/HANA, SAP BPC y SAP BusinessObjects BI, entre otros productos.

Un comentario en “Minería de Texto, una técnica para analizar la Web”

Deja un comentario... Gracias!!!

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s