Análisis exploratorio 🔬

Para poder desarrollar el Chat del Inmortalizado de Mobius AI, es fundamental que comprendamos cómo es la escritura de cada persona. Por ello, es un factor clave estudiar qué palabras emplea, con qué frecuencia, y el significado de las mismas.

  • Palabras totales por usuario

  • Palabras distintas por usuario

  • Palabras más utilizadas por usuarios

  • Stop words

Stop words: las palabras más utilizadas por los usuarios corresponden a artículos, preposiciones o pronombres. Además, dado que solo exportamos texto de WhatsApp, todos los archivos multimedia fueron añadidos como "archivo multimedia omitido" por parte de cada emisor. Estas palabras no aportan valor al análisis de texto, y son conocidas en el dominio de text mining como Stop words. Para omitirlas, por un lado invocaremos las palabras conocidas mediante la utilización de un diccionario que contiene las stop words en español, y por el otro, añadiremos manualmente aquellas que conocemos que no deben tenerse en cuenta.

Conclusión I

Luego de analizar las palabras que utiliza cada usuario, en este caso, denominados "Andi" y "Gastón", a partir de ahora "person 1" y "person 2", podemos determinar varios insights. Por ejemplo:

  • La palabra que más utilizan ambos usuarios es "bro". Esto nos puede ayudar a ajustar el algoritmo, para que sepa que emular la forma de escribir de esas personas, requerirá de escribir con mucha frecuencia dicha palabra. Por otro lado, puede ser certero asegurar que se trata de una conversación entre hermanos.

  • Ambos usuarios hacen referencia a su "casa" constantemente.

  • person 1, evoca constantemente a su madre. Notamos que "mami" y "ma" son dos palabras muy utilizadas.

  • person 2, no evoca a su madre con la misma frecuencia, pero contrariamente, sí hace alusión a su padre con la palabra "papi".

  • person 1, utiliza con mucha frecuencia la palabra "mal", y "olvidate", que, como veremos en un próximo análisis, son palabras que a priori denotan sentimiento negativo. Esto también ayuda a perfilar qué tipo de esencia tiene esta persona.

  • person 2, utiliza frecuentemente las palabras "hacer" y "hoy", que hacen referencia a que posiblemente sea un usuario que se enfoque en las acciones. Por otro lado, contrario a person 1, utiliza mucho la palabra "mejor", lo que nos puede indicar que se trate de una persona con una visión optimista.

Last updated