NLP obtener insights desde texto libre
3 enero 2020

Extracto:

Extraemos insights desde el texto libre. Lo descomponemos en una combinacion lineal de insights a nivel individuo. A continuación nos permite establecer clusters de personas en función de los insights aportados y analizamos sus estrategias.

Articulo:

NLP: Obtener insights desde texto libre.

Share on linkedin
LinkedIn
Share on twitter
Twitter
Share on facebook
Facebook

 

El artículo se basa en mi Trabajo de Fin de Master en Data Science. Podreís acceder tanto al documento original, bajo licencia creative commons, como al video presentado que resume el contenido del trabajo. Este trabajo sorprendió al tribunal por su originalidad y posibles aplicaciones

En este estudio se analizan las diferentes estrategias discursivas, entendidas como combinación de temas, que los individuos usan cuando se presentan ante los demás como producto atractivo, en el contexto de una plataforma de citas online.

Se parte del texto libre que hay en el discurso de cada individuo, del que se obtiene sus palabras. Se determina el número de temas sobre los que se habla y se busca las palabras clave de cada tema con LDA (Latente Dirichlet allocation).

Para etiquetar los temas extraemos la relación semántica entre las palabras clave con la ayuda de un word2vec creado sobre el total de discursos que visualizamos con un TSNE.

Cuando tenemos determinados los temas podemos descomponer el discurso de un individuo como una combinación lineal de los temas utilizados que denominaremos perfil discursivo. Los pesos se interpretan como la relevancia del tema dentro del discurso.

A continuación, con la ayuda de un análisis cluster, se determinamos los diferentes patrones, que denominaremos estrategias discursivas. Por último, se analiza qué estrategias discursivas utilizan las diferentes tipologías de individuos.

Accede el documento original:

Video presentación del TFM al tribunal:

Categorías:

Si tiene comentarios, dudas o necesitas ayuda, contacta conmigo: