Introducción
La imagen, en términos generales, constituye uno de los elementos más importantes en la comunicación. La apariencia que proyectamos es nuestra identidad; es decir, la forma en que nos distinguen de otros. La imagen corresponde a la realidad, pero también a lo que transmitimos o aparentamos. Cuando se habla de la imagen de una persona que despierta interés social se hace referencia que esa persona cuenta con una imagen pública (Orejuela Seminario, 2009).
La imagen pública se ha convertido en un aspecto fundamental de las comunicaciones estratégicas. Se la puede definir como la percepción dominante que una colectividad establece respecto de un actor, institución o referente cultural, con base en las impresiones y la información pública que percibe (Peralta, 2004). Tener una buena imagen es importante para estimular la aceptación positiva por parte de los otros y coadyuvar a mantener una buena comunicación. Por lo tanto, la imagen pública equivale a la opinión y consideración general de los otros. Las imágenes se generan a partir de lo que vemos, y se perfeccionan a través del conocimiento y las experiencias vividas. La imagen se la puede explicar a través de tres dimensiones: realidad, proyección y percepción. Toda persona es una realidad que se proyecta a los demás y, en base a esa proyección, es percibida por los que lo rodean. La imagen pública unifica estas tres dimensiones (Orejuela Seminario, 2009).
La percepción de una imagen en particular puede ser observada a través de las redes sociales, las mismas que son utilizadas libremente por las personas. ellos se expresan sobre temas de interés mediante textos cortos (Reyes Ortiz, Paniagua Reyes & Sánchez, 2017). en este sentido, la red social twitter representa una fuente para captar opiniones espontáneas sobre la percepción de la imagen de personas. Estas opiniones son vistas por una gran cantidad de usuarios debido a su carácter o naturaleza pública. Los tweets (mensajes de texto de Twitter) tienen una limitada extensión lo que obliga a sus usuarios a expresarse de manera breve y precisa, permitiendo al lector entender de forma simple sobre lo que se está refiriendo (Congosto, Fernández & Moro Egido, 2011). Un tweet puede contener las emociones o sentimientos de los usuarios sobre la imagen de una persona.
El análisis de sentimientos ayuda a determinar la polaridad de las opiniones de las personas (Ferran & Hurtado, 2013). Dado a la libertad de expresión de los usuarios que utilizan redes sociales como Twitter, las publicaciones sobre un tema en particular, poseen sentimientos que permiten identificar si lo que se está leyendo es bueno o malo. En este caso la polaridad de las opiniones está dada por la fuerza del sentimiento positivo, negativo o neutro (Sidorov, et al., 2016).
Las emociones o sentimientos cambian a través del tiempo por diversas circunstancias. Estos cambios pueden ser analizados a través del uso de series temporales, que son observaciones tomadas en diferentes momentos que permite representar la variación de la variable (polaridad de las opiniones de Twitter) observada a través del tiempo. El objetivo de análisis de una serie temporal es obtener su patrón de comportamiento el cual permite determinar la tendencia y así poder predecir su evolución en un futuro cercano (Mauricio, 2010).
Este artículo expone el uso del análisis de series temporales y de sentimientos para visualizar los cambios en la aceptación de la imagen de una persona pública dentro de un periodo de observación. Además, hacer uso de la regresión lineal para extraer un modelo que permita observar la tendencia de la polaridad de los sentimientos. Finalmente, presentar el conjunto de palabras más influyentes que reflejan la percepción que tienen las personas de la imagen de una persona pública dentro del ámbito de las redes sociales. Para el efecto, se propone un estudio de caso: Aceptación del presidente ecuatoriano Lenin Moreno en la red social Twitter.
El 24 de mayo de 2017, Lenin Moreno asumió la Presidencia de la República del Ecuador en la segunda vuelta con un 51,16% de obtenidos. El presidente electo contaba con una aceptación de seis de cada diez ecuatorianos. Sin embargo, en la actualidad su nivel de aceptación ha bajado, ahora dos de cada diez ecuatorianos avalan su gestión (Borja & Loaiza, 2019). Es necesario que el gabinete presidencial actúe para incrementar los niveles aceptación del presidente.
El gabinete presidencial se encarga de asesorar al mandatario para mantener su imagen en un nivel de aceptación favorable; por ende, es importante conocer las opiniones ciudadanas para plantear estrategias que permitan atender su imagen. El nivel de aceptación de un mandato gubernamental se basa en la opinión de la ciudadanía (Apablaza & Jiménez, 2009). Por lo tanto, contar con información útil proveniente de la ciudadanía permite tomar decisiones de consolidación para mantener la imagen del mandatario. La obtención de esta información u opinión es realizada mediante encuestas (Ramírez & Varas, 2013). Las encuestas se las realiza con el fin de conocer como los ciudadanos evalúan la gestión gubernamental del presidente. Detrás de cada respuesta existen razones acerca de la opinión que tienen los ciudadanos sobre su gobernante. Algunas de estas razones se basarán en la situación actual del país como la economía, seguridad o decisiones tomadas por el gobierno. Las preguntas utilizadas en las encuestas, por lo general, son cerradas y por lo tanto dejan de ser expresiones espontáneas. La información obtenida es limitada o poco útil para analizar los sentimientos que genera la gestión del presidente.
Twitter es una red social que a diferencia de otras no es recíproca, ya que un usuario puede seguir a otro sin necesidad de que este último haga lo mismo, el usuario seguidor puede observar los mensajes (tweets) de las personas a las que sigue de forma breve, esto por el tamaño del tweet que consta de un máximo de 140 caracteres (Kwak, et al., 2010). Puesto que Twitter es usado libremente por sus usuarios, estos pueden expresar lo que les inquieta aquí se puede discutir y comentar sobre temas en particular constituyendo así la opinión pública a través de medios digitales (Rubio García, 2014).
Esto podría ser aprovechado por el gabinete presidencial para identificar los comentarios sobre la imagen del presidente, clasificarlas y ser utilizadas para mejorar su imagen.
Materiales y métodos
Para el caso de estudio que se presenta se aplicó las siguientes etapas:
Recolección de datos
Pre-procesamiento de datos
Análisis de sentimiento
Aplicación de series temporales
Visualización de resultados
El proceso de obtención de datos fue realizado en dos partes. Primero se obtuvo los datos en los meses de enero, febrero y marzo; estos se utilizan como punto de partida para observar los cambios que puedan ocurrir en la percepción de la imagen pública. A continuación, se obtiene los datos de los meses de junio, julio y agosto que permitirán establecer que cambios en la percepción de la imagen pública han ocurrido. Es importante notar que no se extrajeron datos de los meses de abril y mayo para evidenciar con mayor claridad la variabilidad de las opiniones vertidas sobre la imagen del presidente en Twitter.
Para la obtención del conjunto de datos desde Twitter fue necesario registrarse como desarrollador de aplicaciones en developer.twitter.com y crear un Twitter App para desarrolladores. Esto habilita el acceso a los tweets a través de otros programas. Twitter proporciona las claves y tokens de identificación que permiten el acceso a las aplicaciones para extraer información. La información que se puede extraer es limitada, únicamente es posible acceder a los tweets generados en los últimos nueve días. Se hizo uso de una palabra de búsqueda (“Lenin Moreno”) y el hashtag #LeninMoreno para la selección de los tweets de interés, de esta manera se especifíca la búsqueda Twitter. Los tweets seleccionados vienen en un conjunto de datos que consta de ochenta y ocho variables, de las cuales solo tres se consideraron relevantes para el estudio. Ver Tabla 1.
Variable | Descripción |
---|---|
status_id | Es el identificador del tweet y es utilizado para volver a agrupar las palabras que conforman un tweet. |
created_at | Es la fecha en que se publicó el tweet y es utilizado para analizar los tweets de acuerdo a un periodo de tiempo. |
text | Es el texto del tweet con el cual se realizará el análisis de sentimiento y determinar los términos frecuentes. |
Los conjuntos de datos de los tweets extraídos se almacenan en un archivo csv (comma-separated values) para su posterior análisis. Para el pre-procesamiento de datos se ejecutan dos pasos:
La limpieza del texto consiste en eliminar de los tweets todo aquello que no aporte información sobre la esencia del contenido del tweet.
Resultados y discusión
El análisis de sentimientos consiste en cuantificar y cualificar los sentimientos de las palabras que forman el texto de un tweet. Para este proceso es necesario disponer de un diccionario llamado léxico, el cual asocia a cada palabra un sentimiento o nivel de sentimiento. El diccionario léxico AFINN en versión español asigna un puntaje en el rango de [-5, 5] a cada palabra. Los puntajes negativos corresponden un sentimiento negativo, cero se relaciona con un sentimiento neutro y los puntajes positivos conciernen a un sentimiento positivo.
Con los tweets tokenizados se procede a cuantificar los sentimientos de cada palabra con la valoración de su sentimiento usando el léxico AFINN. Este proceso cuantifica el sentimiento de cada palabra de manera independiente para en lo posterior reagrupar todas palabras en sus respectivos tweets. Una vez obtenidos los tweets cuantificados se procede a realizar la suma aritmética de los valores de sentimiento de cada palabra que componen un tweet. De esta manera se obtiene la polaridad del sentimiento de un tweet.
Para el análisis de series temporales es necesario calcular el promedio de cada polaridad. Es necesario clasificar los tweets de acuerdo a la polaridad obtenida en el proceso de tokenización para obtener el promedio de cada una de las polaridades -positiva, negativo y neutro-. Es prioritario hacerlo por cada día, como se observa en la siguiente Tabla 2.
Fecha | Positivo | Neutros | Negativos |
---|---|---|---|
2019-01-01 | 38.59 | 5.26 | 56.14 |
2019-01-02 | 24.64 | 5.69 | 69.62 |
2019-01-03 | 20.57 | 4.78 | 74.64 |
Obtenidos los promedios de las polaridades de los tweets por día, aplicamos series de tiempo a cada uno de los promedios. Lo que se obtiene son tres series temporales que deben ser unidas para su posterior visualización. Finalmente, se establece un modelo lineal de cada serie tiempo para agregar una línea de tendencia a las series temporales establecidas, esto permitirá apreciar el cambio de las percepciones de la imagen del presidente de la República del Ecuador en el periodo establecido. En esta parte, se hizo uso de la librería zoo para obtener las series temporales.
La visualización descriptiva de las polaridades de los sentimientos expresados en los tweets se presenta en un gráfico de barras. En las barras se presenta el cálculo del promedio de cada una de las tres polaridades de todos los tweets dentro del periodo de análisis.
La variación de la polaridad de los sentimientos de un conjunto de tweets a través del tiempo se lo realiza con series temporales. Se muestra el porcentaje diario de cada polaridad en un sistema cartesiano. En el eje X, se presenta el periodo bajo análisis mientras que el eje Y refiere el porcentaje diario de cada polaridad. Esta representación permite detectar el estado de la percepción de la imagen del presidente de la República del Ecuador. Además, a la gráfica de las series temporales se adjunta un modelo lineal expresado en una línea de tendencia para observar el posible desplazamiento de la polaridad de los sentimientos.
Finalmente, se utiliza una nube de palabras para revelar aquellas más utilizadas en los tweets, clasificadas de acuerdo a su respectiva polaridad y frecuencia de uso. Las palabras de mayor tamaño representan las palabras que más se mencionan y las de menor tamaño a las que se mencionan poco. Para agregar información sobre las palabras de mayor frecuencia de uso se emplea un gráfico de barras que cuantifica la frecuencia de uso de los adjetivos de los tweets y además permite observar cuáles están siendo compartidos por tweets de polaridad de sentimiento positiva y negativa.
En la Figura 1, se muestra el porcentaje total de las polaridades de todos los tweets usados para el caso de estudio. Se distingue que en los dos periodos las opiniones de los usuarios la mayor parte de los tweets han expresado comentarios negativos. En el primer periodo, durante los meses de enero, febrero y marzo, el 64.15% de los tweets tienen polaridad de sentimientos negativos y se obtiene un 31.69% para la polaridad de sentimientos positiva, lo que nos da una relación de 2.02. Para el segundo periodo, en los meses de junio, julio y agosto, el 61.34% de los tweets tienen polaridad negativa y el 34.02% la polaridad positiva, dando una relación de 1.80. Esto indica una ligera mejora de la imagen del presidente de 0.22.
En la Figura 2 se expone la de aplicación de series temporales al análisis de sentimiento en el periodo de análisis de los tweets. Se puede observar el comportamiento de cada polaridad de sentimiento generado sobre el presidente de la República del Ecuador, licenciado Lenin Moreno. En los dos periodos se advierte que los tweets de polaridad de sentimiento negativo superan de forma notable a los tweets de polaridad de sentimiento positivo, los valores obtenidos están cercanos al 60% y 30% respectivamente para ambos periodos; esto indica que por cada dos tweets de polaridad negativa existe uno de polaridad positiva. Los tweets de polaridad de sentimiento neutro están próximos al 0%.
Los modelos lineales, que constituyen las líneas de tendencia, se muestran en la Tabla 3 presentan una mínima variabilidad en los valores de los interceptos y sus valores de inclinación son cercanos a 0°, lo que hace prever que la percepción de la imagen del presidente Lenin Moreno se mantendrán.
Polaridad de sentimiento | Primer periodo | Segundo periodo | Variación de la pendiente ( ° ) |
---|---|---|---|
Positivo | f(p) = 0.106p + 29.487 | f(p) = 0.017p + 32.535 | 5,07 |
Negativo | f(p) = 0.090p + 65.821 | f(p) = 0.038p + 63.442 | -2,96 |
Neutro | f(p) = 0.015p + 4.691 | f(p) = 0.021p + 4.022 | 2.06 |
Las Figura 3 y 4 exhiben el gráfico de nube de palabras para el conjunto de palabras más repetidas y el gráfico de barras de los adjetivos más frecuente, obtenidos en el análisis de sentimiento para el primero y segundo periodo respectivamente.
En el primer periodo prevalece en la polaridad negativa las palabras “traidor”, “peor”, “mal” y fascista”. En los tweets de polaridad positiva resaltan las palabras. “mayor”, “mejor” y legal. Ambas polaridades comparten las palabras de mayor frecuencia de uso: “traidor” y “fascista”.
Para el segundo periodo sobresalen en la polaridad negativa las palabras “traidor”, “peor”, “pasado” y “corrupto”. En los tweets de polaridad positiva destaca las palabras “mejor”, “mayor” y “corrupto”. En este periodo también comparten las palabras de mayor frecuencia de uso: “traidor” y “corrupto”.
Tomando en cuenta los gráficos de barras de las Figuras 3 y 4 se puede establecer, sin ninguna duda, que la imagen del presidente Lenin Moreno está asociado a las palabras “traidor”, “fascista” y “corrupto”.
Conclusiones
El análisis de series temporales combinado con el análisis de sentimientos mostró su capacidad de brindar información acerca de los cambios que pueden ocurrir en la percepción de la imagen de una persona pública en un periodo. Visualizar las polaridades de sentimiento establece un estado de situación de cómo las personas perciben a una imagen pública mediante los distintos comentarios realizados en redes sociales. Para el caso de estudio, permitió visualizar que los sentimientos negativos estaban por encima de los sentimientos positivos en relación de dos a uno.
El modelo lineal obtenido mediante el proceso de regresión lineal simple permite obtener las ecuaciones de las líneas de tendencia del análisis de series temporales aplicado al análisis de sentimiento es útil para medir la variación de la percepción de la imagen de una persona pública e inclusive pronosticar momento de sentimiento se inviertan. Mediante las pendientes del modelo lineal se puede determinar que la rapidez de la variación de la percepción de la imagen. Con los valores de pendientes obtenidos (cercanos a 0°) se prevé que la imagen de Lenin Moreno no cambiará en un futuro cercano.
La nube de palabras es un recurso muy útil para hacer un análisis de las palabras que comúnmente utilizan las personas para expresase acerca de la imagen de una persona pública, de forma general. El gráfico de barras contiene la cuantificación de las palabras de mayor frecuencia de uso. Permite fijar la atención en aquellas palabras que reflejen sentimientos adversos a la imagen de la persona pública sobre la que se trabaja para mejorarla. La imagen del presidente Lenin Moreno está fuertemente ligado a las palabras “traidor”, “fascista” y “corrupto” sobre las cuales se debe plantear una estrategia que permita mejorar su imagen en el futuro.