Archivo de la categoría: Minería de Texto

Buscando datos de clientes “minables”

Comenzar una tarea de minería de datos comienza por identificar un objetivo, “meridianamente” claro, “conocer más a nuestros clientes” o “identificar necesidades/deseos no satisfechos de los consumidores” podrían ser propósitos típicos, en una iniciativa Data Mining.

Contar con suficientes datos para ser “minados” es un requisito indispensable, se trate de una nueva o veterana empresa puede resultar una tarea nada fácil obtener datos actualizados que aporten luces a las conclusiones que se pudiesen derivar del proyecto de Minería de Datos. 

Además de las bases de datos que se pueden adquirir de empresas especializadas en realizar estudios de consumo y mercado, una de las siguientes alternativas podría ayudar a conseguir datos de los clientes que se desean analizar:

  • Publicar un documento y facilitar su descarga gratuita, previa cumplimentación de datos en un formulario.
  • Suscripciones a boletines con la entrega de datos de contacto y preferencias concretas.  Podrían ayudar servicios como el de MailChimp que permite enviar hasta 12.000 mensajes de correo electrónico a 2.000 destinatarios en un mes, gratis. Ver también SocialPro aplicación complementaria a MailChimp
  • Encuestas que solicitarían datos de contacto. Se aconseja revisar los servicios de SurverMonkey.
  • Analizar los datos de los visitantes a las páginas Web de la organización servicios como Pardot  y eTrigue pueden ser de gran ayuda
  • Las cada vez más usuales redes sociales, tales como Facebook, Linkedin o Twitter, pero teniendo en cuenta los términos de uso de cada una de ellas.

Como señala el artículo de referencia, en cualquier caso, se debe ser cuidadoso con las leyes y reglamentos de protección de datos y tener en cuenta lo siguiente:

  • No solicita demasiados datos
  • Claridad con la información que se solicita.
  • Facilidad para darse de baja.
  • Explicar el uso que se le dará a la información aportada

Referencia: PC World

Tiempo de “Socialytics”

Ya sea para mejorarla atención al cliente, optimizar la oferta de productos, detectar con rapidez las oportunidades y amenazas del mercado, etc; la información que se genera fuera de las paredes de la organización es una fuente de datos que se debe analizar.

En los últimos meses han ido surgiendo un mayor número de recursos para el “análisis de los medios sociales 2.0” (también denominado como Socialytics), la ausencia de estructuras formales en su composición, no es impedimento para que las empresas puedan ver en las redes sociales el mejor mecanismo de feedback que pudiesen tener.

¿Socialytics para todos?

Inicialmente podríamos considerar que “Social media analytics” debería ser sólo para las grandes organizaciones que tienen gran presencia en Internet, que se escribe mucho de ellos y que requieren herramientas para analizar los grandes volúmenes de información que de ellas se genera, pero sería una apreciación sesgada.

Las pequeñas o medianas empresas, podrían valorar la información de otras organizaciones y quizás encontrar oportunidades o simplemente, aprender de experiencias ajenas.  Consideramos que la necesidad de Socialytics dependerá, como apuntábamos en un post anterior, de las inquietudes o preguntas que se formulen y se deseen dar respuesta.

SAP Social Intelligence

El nuevo nombre del prototipo de SAP para análisis de redes sociales se denomina SAP Social Intelligence (antes se le conocía como Social Network Analyzer) se integrará a la plataforma de colaboración SAP Streamwork, a continuación un reciente vídeo sobre esta herramienta.

Referencia: ZDNet, SAP StreamWork.com

¿Con “Análisis de Texto” se hubiera evitado el Cablegate de Wikileads?

La publicación en Wikileads de las comunicaciones de los representantes consulares de los EEUU en casi todos los países del mundo, conocido como Cablegate, han encumbrado a la categoría de mito y casi héroe, al fundador de este portal.  Pero más que un “error de seguridad de la información”, lo que queda en evidencia es el ridículo e ineficiente papel que desempeña la diplomacia estadunidense al elaborar estos informes.

Muchas veces estos “cables” recopilan los comentarios populares de cada país, los cuales juntos son utilizados para elaborar el “perfil” de algún político.  Nos preguntamos, ¿es un método acertado para elaborar estos “estudios”?

El Análisis de Texto, en tendencia

El análisis de texto brinda la posibilidad de estudiar los contenidos de mensajes, blogs o en redes sociales; los cuales no son almacenados de manera estructurada, tal como puede ser una base de datos.  El buen uso de estas herramientas pueden facilitar la obtención de patrones, relaciones o tendencias, o inclusive, pueden ayuda ha distinguir la información valiosa.

Según Forrester, el Análisis de Texto (Text analytics) será una de las principales tecnologías  para los próximos tres años.  Además de lo mencionado en el párrafo anterior, el AT debe ser visto para las siguientes circunstancias:

  • Análisis y búsqueda de información
  • Operaciones TI para identificar el contenido de alto valor y cual se puede eliminar
  • Análisis de redes sociales

Consideramos que la seguridad comienza por identificar las fuentes adecuadas de información y utilizando los mecanismos más óptimos para obtenerla y mantenerla. Ante todo, la “anécdota” de Wikileads es una llamada de atención a la eficiencia más que seguridad propiamente dicha.

Referencia: Forrester

Nuevo nicho en la Consultoría, Búsquedas empresariales y la Web 2.0

Se esta produciendo en la empresa el cambio de paradigma que ya se ha producido en Internet, no es tan importante como se guardan los datos, sino como se acceden a ellos en el menor tiempo posible, no importando si son datos estructurados o no estructurados.  Se estima que más del 70% de la información que se gestiona en las empresas es no estructurada.

La necesidad ahora, esta en la empresa de acceder y compartir, con rapidez, seguridad y sencillez la información disponible.  Es crucial disminuir el tiempo que se invierte en buscar información, se calcula que hasta el 30% del tiempo de los trabajadores se dedica a estas tareas.

Es en este panorama que esta tomando mayor fuerza los denominados Buscadores Empresariales (Corporativos o únicos).  Las consultoras más especializadas en analizar las tendencias del sector de las Tecnologías de la Información (TI); Gartner e IDC, prevén tasas de crecimiento de dos dígitos en este, relativamente, nuevo segmento.

Estas herramientas integran e indexan cualquier fuente de datos, sea estructurada o no estructurada, en tiempo real, siendo capaz de acceder a distintas plataformas, diferentes bases de datos o cualquier formato utilizado en la denominada Web 2.0.

La mayoría de fabricantes que ofrecen una plataforma de Business Intelligence (BI) ofrecen una solución de estas características.  Algunos de estos buscadores utilizan sus motores de búsqueda con algoritmos propios, otros utilizan las herramientas que ofrece Google para este fin (Google Search Appliance).  Obtenida la información que se esta buscando, estos productos facilitan el análisis de los datos con los productos de BI que ya disponen.

Principales propuestas de buscadores empresariales:

(Más información)

aníbal goicochea


Minería de Texto, una técnica para analizar la Web

La información que tienen a su disposición las empresas, proviene de diversos orígenes y tienen variados formatos, se estima que cerca del 70% de estos datos son “no estructurados”, es decir, no obedecen a estándares informáticos que facilitan su tratamiento.  Esta información, que se expresa en el leguaje natural, el que todos empleamos, esta contenida en documentos, mensajes de correo electrónico, páginas Web, feeds de RSS (de blogs y noticias), notas de servicio, encuestas, reclamos, curriculums, registros de llamadas, etc.

No tomar en cuenta esta información, sería como negarse a ver gran parte del panorama que tenemos a nuestra disposición.  Para facilitar el análisis de estas fuentes de datos, contamos con la Minería de Texto (Text Mining) que utilizando técnicas de Procesamiento del Lenguaje Natural (NLP), permite transformar toda esta información en formatos estructurados o semi-estructurados que van a facilitar las tareas del análisis e interpretación de la información.

Contando con información estructurada, se podrá hacer uso de las técnicas de Minería de Datos (Data Mining), algo más conocido, para facilitar el descubrimiento de patrones, tendencias, desviaciones y detectar asociaciones entre nuestros objetos de estudio.

Software Mineria Texto

Existe software que permite las tareas de minería de texto, quizás por el tiempo que llevan en el mercado de la “Inteligencia empresarial” (Business Intelligence) los más reconocidos son el de SAS y SPSS.

 http://www.sas.com/technologies/analytics/datamining/textminer/index.html#section=1

http://www.spss.com/software/modeling/text-analytics/

 Ag.