SciELO - Scientific Electronic Library Online

 
vol.10 issue25Metadata for Digital National Newspaper Library of México. Approximations for an ontology.Natural language processing for the critical evaluation of communication manuals aimed at the exercise of journalism with a gender perspective author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Alcance

On-line version ISSN 2411-9970

ARCIC vol.10 no.25 La Habana Jan.-Apr. 2021  Epub Apr 01, 2021

 

Itinerario de Investigación

Humanidades digitales: un acercamiento a metodologías emergentes desde el caso #ElectionsUSA

Digital Humanities: an approach to emerging methodologies from the case #ElectionsUSA

Karines Rodríguez Díaz1  * 
http://orcid.org/0000-0002-9349-9386

Yamile Haber Guerra1 
http://orcid.org/0000-0001-7200-5714

Miguel Ernesto Gómez Masjuán2 
http://orcid.org/0000-0003-2575-2455

1Universidad de Oriente, Facultad de Humanidades, Departamento de Periodismo. Santiago de Cuba, Cuba.

2Universidad de La Habana, Facultad de Comunicación. La Habana, Cuba.

RESUMEN

Las últimas investigaciones en torno a las humanidades digitales han sido en su mayoría propositivas y con una trayectoria transdisciplinar. El estudio relacionado con las nuevas tecnologías en el campo está guiado por la selección de herramientas propias del big data y aplicaciones que facilitan transformar datos cuantificables en datos cualitativos, en un enfoque mixto de detección de patrones. El informe de investigación tiene como objetivo caracterizar el discurso emitido bajo el hashtag #ElectionsUSA utilizando las aplicaciones de minería de datos Stela y Brand 24, además del análisis del discurso multimodal. Es un estudio descriptivo que expone conclusiones sobre el encuadre asumido por usuarios de Twitter en torno al acontecimiento noticioso de las elecciones norteamericanas durante el mes de noviembre de 2020. Así mismo muestra el uso de metodologías emergentes propias de las ciencias informáticas en la disertación sobre humanidades digitales y comunicación.

Palabras clave: #ElectionsUSA; minería de datos; análisis del discurso multimodal; humanidades digitales

ABSTRACT

The latest research on the digital humanities has been mostly propositional and with a transdisciplinary trajectory. The study related to the new technologies in the field is guided by the selection of big data tools and applications that facilitate the transformation of quantifiable data into qualitative data, in a mixed approach of pattern detection. This research report aims to characterize the discourse issued under the #ElectionsUSA hashtag using the Stela and Brand 24 data mining applications, in addition to multimodal discourse analysis. It is a descriptive study that presents conclusions about the framework assumed by Twitter users around the news event of the North American elections during the month of November 2020. It also shows the use of emerging methodologies from computer science in the dissertation on digital humanities and communication.

Keywords: #ElectionsUSA; data mining; multimodal discourse analysis; digital humanities

Introducción

El principal hito que facilitó la cohesión de las humanidades digitales como materia fue la evolución y desarrollo de la interfaz gráfica del usuario. Con ello la capacidad de manipular la información textual, cuantitativa, gráfica, geográfica, audiovisual o multimedia para la investigación humanística se hizo patente y contribuyó al aprovechamiento de herramientas computacionales. (Melo y Gayol, 2017: 282).

La mayoría de los autores hablan de Humanidades Digitales desde un punto de vista propositivo, no se hablan de teorías generalistas en torno al tema, se trata de una relación transdisciplinar, aún exploratoria, aunque cambiante como los procesos digitales en línea.

Los métodos estadísticos e informáticos, y otros métodos de las ciencias sociales, se han transformado y han sabido adaptar sus modelos conceptuales a la complejidad de los textos (English y Underwood, 2016). Desde el año 2011 la expresión «Big Data» se ha extendido en las ciencias experimentales y los medios de comunicación como si el incremento de los datos disponibles fuera la próxima revolución científica. (del Rio Riande, 2019)

La definición clásica de «Big Data» consta de una fórmula fácil de entender y memorizar -las tres V-: el Volumen (Terabytes, Petabytes, Exabytes), la Velocidad (datos en continua generación) y la Variedad (textos, imágenes, sonidos) (Ward y Barker, 2013).

Las humanidades digitales ponen su acento en la naturaleza cultural de los datos, con la expansión de las redes sociales y otras plataformas de social media, sus lenguajes, sin los cuales no se entendería el auge del Big Data, vienen siendo usados en un número creciente de aplicaciones (Sánchez, 2014) que facilitan las búsquedas y actividades investigativas a través de filtros y métricas de fácil manejo.

Este principio se puede llamar la “estructura fractal de los nuevos medios”. De la misma manera que un fractal posee la misma estructura a diferentes escalas, el objeto de los nuevos medios presenta siempre la misma estructura modular. Los elementos mediáticos, ya sean imágenes, sonidos, formas o comportamientos, son representados como colecciones de muestras discretas (píxeles, polígonos, vóxeles, caracteres o scripts), unos elementos que se agrupan en objetos a mayor escala, pero que siguen manteniendo sus identidades por separado. (Manovich, 2006:9) Se vuelve posible separar el nivel del «contenido» (los datos) del de la interfaz. (Manovich, 2006:13)

En este sentido se han manifestado presupuestos teóricos propios de las ciencias blandas en los espacios online. Así por ejemplo la comunicación adopta teorías ya formuladas como el crowdsourcing o el gatewatching (Canavilhas, 2011; Burns y Highfield, 2015), mientras que se ajustan metodologías como la lingüística de corpus (Martínez, 2015), análisis del discurso multimodal (O´Halloran, 2012), análisis de big data (Colle, 2017), análisis de redes sociales (Aguirre, 2011), minería de datos (Baeza, 2009), estudios etnográficos del usuario (Hine, 2011; Méndez y Aguilar, 2015), ciberpragmática (Sykes, 2011), sociología de la tecnología (Aibar, 1996; Aguiar, 2002) , neuromarketing (Lim, 2018), semiótica de las interfaces (Scolari, 2018), hipermediaciones (Scolari, 2008), entre otras.

No obstante, debemos a otras ciencias la proposición de metodologías útiles de estudio como el análisis de redes sociales, la minería de datos (análisis de sentimientos, grafos1, polaridad2, multimedia); mientras que nuestras propias materias adaptan sus modelos metodológicos a las nuevas circunstancias contextuales como lo ha hecho por ejemplo el análisis del discurso multimodal en los espacios marcador por ejemplo por estructuras narrativas hipertextuales y multisoportes.

El problema metodológico general de las humanidades digitales puede ser planteado de manera muy simple y muy clara: ¿cómo pasamos de los números a los significados? Los objetos que se investigan, las pruebas que se recogen, las formas en que se analizan, todo eso es cuantitativo. Cómo pasar de este tipo de evidencias y de objetos a argumentos cualitativos y a reflexiones sobre temas (Heuser y Le-Khac,2012: 46); estas cuestiones se desarrollan de manera cualitativa al detectar patrones que dan lugar a resultados en mejoramiento continuo; sobre todo desde la perspectiva del aprendizaje automatizado (machine learning3).

Varios autores en el campo de la comunicación, aunque no han hablado sobre humanidades digitales propiamente dicha, han propuesto herramientas útiles en la materia. Así por ejemplo:

La lista pudiera ser interminable, aunque la mayoría de las investigaciones se concentran en la red social Twitter, probablemente porque es una de las más abiertas, de la que existen más aplicaciones para procesamiento de datos y un apartado específico para desarrolladores que permite una extracción gratuita del contenido de los tweets de los últimos 7 días. Así mismo, los autores, se dedican mayoritariamente al estudio de los textos probablemente porque el machine learning está más avanzado informáticamente en ese aspecto, aunque lo asociado con las imágenes y videos atraviesa un análisis más complejo pese a ser la mayor parte del contenido disponible en Internet (Oviedo y Velez, 2016).

El informe de investigación tuvo como objetivo caracterizar el discurso emitido bajo el hashtag #ElectionsUSA utilizando las aplicaciones de minería de datos Stela y Brand 24, además del análisis del discurso multimodal.

Métodos

Contexto situacional: #ElectionsUSA

Twitter es una de las redes sociales más utilizadas por los usuarios en Internet, según los últimos datos estadísticos publicados por Hootsuite (2020) cuenta con alrededor de 353 millones de usuarios activos. Es también una de las más utilizadas con fines políticos y propagandísticos.

En este sentido analizamos uno de los tweets más relevantes asociados a las elecciones para el 46 presidente de los Estados Unidos, las mismas fueron realizadas el 3 de noviembre de 2020 en un contexto marcado por la crisis sanitaria del coronavirus y un previo juicio político de impeachment al presidente saliente. Uno de los espacios más utilizados de manera directa por Trump fueron sus dos cuentas verificadas de Twitter @realDonaldTrump y @POTUS para difundir un posible fraude en el proceso eleccionario luego de que Joe Biden fuera declarado ganador sobrepasándole por más de 7 millones y tras haber obtenido mayor número de votos electorales. El 8 de enero de 2021 la BBC publica la suspensión permanente en Twitter de las cuentas pertenecientes a Trump por el riesgo de mayor incitación a la violencia tras el ataque de manifestantes al capitolio.

Durante el mes de noviembre tuvieron lugar numerosas discusiones por parte de las comunidades virtuales en Twitter en torno a las votaciones y elecciones presidenciales, asunto que ofrece una perspectiva descriptiva de los encuadres adoptados por los usuarios durante y en el momento de las declaraciones.

Problema de investigación: ¿Cuáles fueron los encuadres discursivos de los usuarios en Twitter con el hashtag #ElectionsUSA?

Objetivo: Caracterizar los encuadres discursivos de los usuarios en Twitter con el hashtag #ElectionsUSA

El presente informe de investigación es de vital importancia para entender la producción de los usuarios en comunidades virtuales, las estructuras sociales que dan lugar a la distribución del discurso sobre #ElectionsUSA. Nos permite acercarnos a apartados tan necesarios de estudio en la comunicación y humanidades como las representaciones simbólicas de la opinión pública, las relaciones sociales en el microblogging y el desarrollo productivo del contenido por parte de los usuarios, que incluye actividades como la publicación de memes, contenido gráfico y videos. Así mismo muestra en la práctica la aplicación de técnicas y métodos de enfoque mixto como la minería de datos y el análisis del discurso multimodal, metodologías en apogeo en las ciencias humanísticas de los últimos tiempos.

Diseño de investigación

La investigación fue descriptiva de enfoque mixto. La metodología principal utilizada fue el análisis del discurso multimodal, un paradigma emergente en el campo de los estudios del discurso que amplía el estudio del lenguaje per se al estudio del lenguaje en combinación con otros recursos (O´Halloran, 2012: 75), útil ante la cualidad multisoporte de los mensajes en Twitter.

Además, se utilizó la minería de datos (textos, grafos, y multimedia) para la sustracción y filtrado de los textos publicados bajo el hashtag #ElectionsUSA. Según Baeza-Yates (2009) la minería de datos en redes sociales funciona con utilidad en la determinación de percepciones. El concepto de minería de datos o data mining agrupa técnicas computacionales que permiten descubrir informaciones poco, especialmente características que relacionan de un modo inesperado - o difícil de descubrir - los valores de múltiples variables en una gran cantidad de registros.

“La minería de datos no elimina la participación humana, los métodos son variados y el software existente incluye habitualmente una “batería” de programas que operan de distintas maneras y entregan distintos tipos de resultados, en su mayoría acompañados de formas visuales destinadas a poner en evidencia las relaciones descubiertas” (Colle, 2017).

La guía de análisis se aplicó sobre una muestra o corpus total de 13 661 tweets sustraídos a través de la plataforma Stela para determinar la polaridad y filtrar los tweets y usuarios más mencionados e influyentes en la conversación en el microblogging. A través de Stela extrajimos gratuitamente el histórico de sus mensajes de los últimos 7 días a través de la interfaz de programa de aplicación (API) de Twitter (REST y Streaming), recurso gratuito. Utilizamos además la aplicación disponible en la web Brand24 que facilitó reconocer la influencia4, alcance5, y nivel de participación6 de los usuarios que mostramos en el siguiente apartado.

Se aplicó un análisis más específico a aquellos tweets con mayor influencia, cuyo autor fuera más mencionado o tuviera mayor alcance para reconocer los principales encuadres distribuidos por la comunidad virtual. Los tweets sustraídos se encontraban en los idiomas inglés, francés, portugués y español y se les aplicó la siguiente guía de análisis:

  1. Total de tweets analizados

  2. Polaridad del total de tweets

  3. Palabras más repetidas en el cuerpo de los tweets

  4. Días de mayor actividad

  5. Menciones más populares y sus encuadres.

  6. Perfiles públicos más activos

  7. Perfiles más influyentes.

  8. Contenido y temáticas más tratadas en los tweets de los perfiles más activos y más influyentes.

  9. Cambios en la dirección del tema central #electionsUSA o tratamiento de temáticas asociadas de manera aislada.

  10. Uso de recursos multimediales en el total de tweets y su encuadre.

Desarrollo

Total de tweets analizados: 13 661

Se seleccionó una muestra general de 13 661 tweets publicados en el mes de noviembre de 2020, sustraídos por el software Stela de manera aleatoria. Sobre los mismos se aplicó el análisis de la polaridad (Figura 1), de este corpus total también se sustrajo las palabras más repetidas y los días de mayor actividad. Los tweets de la muestra sustraída fueron publicados en idioma inglés, español y francés.

Polaridad del total de tweets

Fuente: Elaboración propia basada en resultados obtenidos a través de Stela.

Fig. 1 Polaridad del total de tweets analizados. 

Palabras más repetidas en el cuerpo de los tweets

En este orden (empezando por la más utilizada según el software Stela) las 10 palabras más repetidas fueron: #electionsUSA, elections2020, Trump, fraude, joebiden, giuliani, fraudeselection, Donald, president, electionday.

Días de mayor actividad (fuente: Stela)

Del 1 al 5 y del 8 al 11 de noviembre de 2020 que coincide con la fecha de votaciones y la cercanía a los resultados generales emitidos sobre el ganador de las elecciones norteamericanas.

Menciones más populares y sus encuadres

@HaroldTribune_ (19 de noviembre de 2020, traducido del francés): Rudy Giuliani da una conferencia de prensa: 200 declaraciones de agentes electorales sobre el fraude. Se alega que los demócratas han hecho trampa en Pennsylvania, Michigan, Georgia. El objetivo: descertificar los resultados comunicados anteriormente. "300.000" votos falsos en Detroit. Sus propias hiperextrapolaciones #ElectionsUSA

El anterior tweet se encuadra en las hiperextrapolaciones por parte del presidente Trump para aseverar la existencia de un fraude. Es importante reconocer como el autor (periodista francés) utiliza recursos como las comillas para denotar la falsedad de la noticia. De la muestra fue uno de los que más reacciones contempla, obteniendo respuestas asociadas a contrarrestar tal afirmación a manera de negatividad: @NonBinaire: ¿Y si no son hiperextrapolaciones?, @wissam82172356: Las deposiciones de los funcionarios electorales no son técnicamente hiperextrapolaciones en los tribunales.

@Mwcartoons (traducido del inglés, 22 de noviembre del 2020): Peleando en una batalla perdida. Ha perdido la cabeza de todas formas. (Gracias Nool Kooij por la idea) #trump, #pence #mikepence #donaldtrump #republicans #donquixote #donquichotte #elephant #uselections #elections2020 #electionsusa @cartoonmovement @cartooningPeace @Joop_nl (Fig. 2)

Fig. 2 Contenido gráfico del tweet de @Mwcartoons. 

@galilea_arg (19 de noviembre del 2020): #FilmameEstoNestor #Minas en la #CasaBlanca por @Julaju y @palolauahiba Podés leer la nota completa en: galilea.ar/2020/11/filmam… #EleccionesEEUU #ElectionsUSA #TheSquad #KamalaHarris #SarahMcBride #WhiteHouse El tweet original en español ofrece un enlace a un trabajo periodístico sobre las minas, es decir mujeres o miembros de la comunidad LGBTIQ+ que han ocupado un escaño en la Casa Blanca y el senado durante las elecciones norteamericanas de 2020; entre estas menciona a Kamala Harris, Teresa Leger Fernández y Deb Haaland por Delaware, Sarah McBride, la primera senadora transgénero en Estados Unidos, y la republicana Cynthia Lummis que fue electa la primera mujer senadora por Wyoming. La cuenta que emite el tweet se califica como periodismo alternativo, de transformación social y feminista y está geolocalizado en Córdoba, Argentina.

@studioandydna (19 de noviembre de 2020, traducido del inglés): George #Soros es el mayor donador al #Antifa & #BLM - Rudy #Giuliani #Election2020

Pertenece según la descripción su bio a un artista visual contemporáneo de nacionalidad suiza y, en este caso, enmarca a George Soros en la conversación en el microblogging sobre las elecciones del 46 presidente norteamericano, aunque no explicita en qué sentido incluye a esta figura pública.

Comparte a la misma vez un video con más de 61 mil reproducciones donde Soros niega donar dinero a instituciones o gobiernos como el de Venezuela. Aquí podemos considerar el tweet como un cambio en la dirección de la conversación de las comunidades virtuales que siguieron el hashtag #electionsUSA.

@RegisHounkpe (19 de noviembre de 2020, traducido del francés): interglobeconseils.org/blog/pour-la-d… #InterglobeConseils #Geopolitique #electionsUSA

El autor es el director ejecutivo de @InterglobeC, identificada como Empresa de consultoría en conocimientos geopolíticos, cooperación internacional y comunicación estratégica. El tweet es un enlace a un texto periodístico sobre cómo cambiarían las cosas en África de acuerdo a los resultados con la elección de Joe Biden como presidente de los Estados Unidos.

De esto modo inserta la importancia de las elecciones norteamericanas en el contexto y desarrollo global, aunque lo hace de una manera hipermedial en la que la continuidad del mensaje depende del cotexto, es decir del enlace a seguir que publica en el tweet sin aclaraciones específicas sobre el contenido que distribuye.

-@Enfantdabord2 (23 de noviembre de 2020, traducido del francés): #ElectionsUSA: #Trump ¿Cree en su derrota para sorprender mejor a su oponente?

-@LennyFe01716924 (19 de noviembre de 2020): Todavía creo que el presidente @realDonaldTrump no perdió las elecciones… ¿eso es mucha perseverancia? #electionsUSA #Election2020 #trustiinvote #WeAreTrump

- @PSVICE (18 de noviembre de 2020): #FakeElectionsUSA #Elections2020 #ElectionsUSA #BidenGoesToJail Lin Wood, abogado de @realDonaldTrump, sobre las nuevas pruebas: “@JoeBiden va a ir a la cárcel” - Libertad Digital.

Perfiles públicos más activos

Fuente: Elaboración propia basada en resultados obtenidos a través de Brand24.

Fig. 3 Alcance y menciones de los perfiles públicos más activos. 

Perfiles más influyentes

Fuente: Elaboración propia basada en resultados obtenidos a través de Brand24.

Fig. 4 Nivel de influencia de los usuarios más influyentes. 

Fuente: Elaboración propia basada en resultados obtenidos a través de Brand24.

Fig. 5 Nivel de participación de los usuarios más influyentes en la conversación. 

Contenido y temáticas más tratadas en los tweets de los perfiles más activos y más influyentes

En el total de tweets la mayoría de los temas se refieren más que al triunfo de Biden a la derrota de Trump desde diferentes perspectivas polarizadas, siendo este último el punto principal de la conversación en la muestra analizada. En algunos casos se etiqueta a Biden pero el punto central de la conversación responde a la figura de Trump.

La defensa de Trump por los usuarios desde Twitter, por un lado, asume un apoyo desmedido fundamentalmente de usuarios comunes no vinculados a instituciones mediáticas y por otro con una aprobación del asunto como fraude siguiendo y citando las propias palabras de @realDonaldTrump. Otras publicaciones del lado contrario defienden a cabalidad la idea de una hiperreacción exagerada del mandatario saliente ante la derrota, así, por ejemplo:

@fvallois: (5 de noviembre de 2020, traducido del francés): Estas elecciones de EE.UU. nos permiten (re)honrar dos términos aprendidos: - "Ipsedixis": la tendencia a tomar todas las palabras de una figura de autoridad como verdaderas. (#Trump) - "Ultracrepidarianismo": la tendencia a hablar con confianza sobre temas que no conoces (#Twitter)

@fvallois: (8 de noviembre de 2020, traducido del francés) Un pequeño inconveniente en la portada francesa de #ElectionsUSA, además muy interesante: la presencia insuficiente de psicólogos en los platós para intentar comprender las reacciones irracionales de #Trump.

@fogiesbert (12 de noviembre de 2020, traducido del francés): FOG - El fenómeno del triunfo o el gran fracaso mediático. Sólo porque el ex presidente esté histérico no significa que la prensa deba ponerse histérica https://lepoint.fr/tiny/1-2400521 #FOG vía @LePoint #Medios de comunicación #eleccionesUSA

Así mismo se muestra en los tweets un desconcierto o espera respecto a la resolución y análisis del posible fraude y de la información sobre los resultados finales.

@Ticia166 (27 de noviembre de 2020, traducida del francés) Esperamos con interés la fecha del 14 de diciembre, para que finalmente se pueda arrojar luz sobre estas #eleccionesusa que los #electores de @JoeBiden no te alegres demasiado rápido. @POTUS no ha dicho su última palabra.

@USPressCorpsPR (24 de noviembre de 2020, traducido del inglés): Trump finalmente acepta la transición de Biden pero aún así se niega a ceder (VIDEO) El presidente electo de los Estados Unidos, Joe Biden, ha recibido formalmente el visto bueno para comenzar su transición a la presidencia. #EleccionesEEUU https://youtu.be/n6o4Cu4evdI a través de @YouTube

@CLSIOGOMES3 (5 de noviembre de 2020, traducido del portugués): ¿Cómo puede haber fraude electoral en la mayor democracia del mundo, Sr. Trump? ¿Qué "sanciones deberían imponer los países africanos a los Estados Unidos"? Sí, porque si eso ocurriera en África, a mediados de 2020, las tropas y los misiles ya estarían listos para el ataque

@BVoltaire (6 de noviembre de 2020, traducido del francés): [ENTREVISTA DE AUDIO] @andrebercoff Es indiscutible que hubo fraude en el voto por correo, la disputa debe resolverse antes de que se anuncie el resultado" Flecha hacia la derecha https://bvoltaire.fr/andre-bercoff-cest-incontestable-quil-y-a-eu-fraude-dans-le-vote-par-correspondance-le-contentieux-doit-etre-regle-avant-la-proclamation-du-resultat/ #El día de las elecciones en EE.UU., triunfo, bendición de las elecciones, fraude...

  1. Cambios en la dirección del tema central #electionsUSA o tratamiento de temáticas asociadas de manera aislada.

    • En el conjunto de la muestra el tema central giró en torno a la elección del presidente, sin embargo, hubo temas que se aislaron del tema central que seguía la comunidad virtual:

      • Relación entre la derrota de Trump y la elección de Biden con el desarrollo y cambios en el continente africano.

      • Temas asociados con la elección del senado y miembros elegidos que forman parte de la comunidad LGBTIQ+ o que son mujeres que por primera vez ocupan un escaño importante de manera histórica,

      • Inserción del nombre de George Soros en relación con la etiqueta #ElectionsUSA.

      • Derechos humanos de los afroamericanos en Estados Unidos.

  2. Uso de recursos multimediales en el total de tweets y su encuadre.

Un 28 % de los Tweets publicados analizados en la muestra contenían imágenes o videos según el software Stela. De ellos la mayoría completaban la información del texto del tweet o denotaban un contenido independiente por lo que son totalmente necesarios para entender el sentido ofrecido por el usuario en el contexto. Los más utilizados fueron memes o referencias gráficas.

El más mencionado lo podemos encontrar en el apartado 1 del análisis de los resultados donde @Mwcartoons coloca a Trump como Don Quijote y a Pence como Sancho Pansa en un intento por seguir su lucha contra los molinos de viento, una forma de relación intertextual con el pasaje de Don Quijote. Otro usuario que asumió una representación simbólica usando elementos gráficos fue @lectrr quien muestra un infomapa donde el color rojo muestra los estados ganados por Trump y el azul las fake news. Otro gráfico de este último autor presenta a Biden, y Kamala Harris indicando el estado al que pertenecen y a Donald Trump como estado de negación; es importante mencionar que este usuario no adopta una postura directa en torno a aceptar o denegar el resultado de las elecciones, solo presenta las imágenes sin asumir una polaridad determinada de manera denotada en el contenido escrito del tweet.

Consideraciones finales

Los encuadres bajo el hashtag #ElectionsUSA estuvieron dirigidos a la figura de Donald Trump como el punto principal y la detección del tema del fraude de las elecciones como uno de los temas más comentados. Aunque algunos autores defendieron una hiperreacción ante la posición trumpista denotamos una elevación de la figura pública en el discurso y se dio una mayor importancia a su derrota que a la propia elección del presidente Joe Biden. El caso de estudio presentado muestra resultados imposibles de obtener sobre tan abundante contenido de datos sin la utilización de métricas y programas de apoyo.

Tal y como mostramos en el análisis de los resultados el uso de recursos como el clustering , el análisis de la identidad de los usuarios, la revisión automática de hipertextos e imágenes es una exigencia de las investigaciones contemporáneas en humanidades y comunicación. Tareas propias de la data mining como la recuperación de información, análisis, interpretación, detección de patrones se hacen imprescindibles en las humanidades digitales en las cuales podemos alcanzar además un mayor grado de fiabilidad sobre grandes volúmenes de datos disponibles de auditar. De ahora en adelante las humanidades digitales han de ser pensadas en dos aspectos: la interdisciplinaridad que supone su basamento teórico metodológico y la necesidad de softwares especializados en sus investigaciones.

Aunque se vaticina una cierta decadencia de las humanidades, estas no hacen más que adaptarse a las modificaciones impuestas por el desarrollo de las tecnologías y a las facilidades que impone el desarrollo de las aplicaciones. “Ya estamos viendo que el mayor desafío a la hora de desarrollar métodos digitales de humanidades puede que no sea cómo extraer datos de objetos humanísticos, sino cómo analizar esos datos de manera significativa e interpretable (Heuser y Le-Khac, 2012: 4)”. Los avances de los desarrolladores y el machine learning proporcionan un marco adecuado de integración, y abren nuevas perspectivas en el estudio de las humanidades digitales.

Agradecimientos

Al Desarrollo de Aplicaciones, Tecnología y Sistema (Datys).

Referencias bibliográficas

Abascal, R.; López, E. y Zepeda, S. (2014). Detección de patrones y grupos de sentimientos a partir del análisis de tuits políticos. Pistas Educativas, 35(108), 1672-1691. https://bit.ly/2VWUAtNLinks ]

Aguiar, D. S. (2002).Determinismo tecnológico versus determinismo social: Aportes metodológicos y teóricos de la filosofía, la historia, la economía y la sociología de la tecnología. Tesis de licenciatura. Universidad Nacional de La Plata. Facultad de Humanidades y Ciencias de la Educación. [ Links ]

Aguirre, J. L. (2011). Introducción al análisis de redes sociales.Documentos de Trabajo del Centro Interdisciplinario para el Estudio de Políticas Públicas,82, 1-59. https://bit.ly/35MYs54Links ]

Aguirre, J.L.; Hernández, C.C; Briceño y Marín, A.M. (2018). Emociones e interacción ciudadana: análisis de la comunicación emocional de los residenciables en Twitter y Facebook. En B. Gómez y J.L. López (Eds.), Agenda sociodigital de la campaña presidencial de 2018 (pp. 108-130). Torreón, Coahuila: Universidad Autónoma de Coahuila. https://bit.ly/2KUaleO [ Links ]

Aibar, E. (1996). La vida social de las máquinas: orígenes, desarrollo y perspectivas actuales en la sociología de la tecnología. Reis, 141-170. https://doi.org/10.2307/40183990 [ Links ]

Almgren, S.M., Olsson, T. (2015): “Lets get them involved... to some extent: Analyzing online news participation”. Social media + society, v. 1, n. 2. Disponible en: http://doi.org/f3m9j4 [ Links ]

Arcila, C.; Ortega, F.; Jiménez, J.; Trullenque, S. (2017). Análisis supervisado de sentimientos políticos en español: clasificación en tiempo real de tweets basada en aprendizaje automático. El profesional de la información, v. 26, n. 5, 973-C82. https://doi.org/10.3145/epi. 2017.sep.2018 [ Links ]

Arcila-Calderón, Carlos; Barbosa-Caro, Eduar; Cabezuelo-Lorenzo, Francisco (2016). “Técnicas big data. Análisis de textos a gran escala para la investigación científica y periodística”. El profesional de la información, v. 25, n. 4, pp. 623-631. https://doi.org/ 10.3145/epi.2016.jul.12Links ]

Arnáiz, S.M. y Filardo, L. (2020). Llamamientos feministas en Twitter: ideología, identidad colectiva y reenmarcado de símbolos en la huelga del 8M y la manifestación contra la sentencia de ´La manada´. Dígitos, 1(6), 55-78. http://doi.org/dx72 [ Links ]

Baeza, R. (2009). Tendencias en minería de datos en la web. El profesional de la información, 18(1), 5- 11. http://doi.org/fksfc2 [ Links ]

Baviera, T. (2017). Técnicas para el análisis de sentimiento en Twitter: aprendizaje automático Supervisado y SentiStrenght. Dígitos, 1(3), 33-50. https://bit.ly/3dTVqOKLinks ]

BBC (3/12/2020). Trump vs. Biden: las otras elecciones de este 3 de noviembre en Estados Unidos más allá de la carrera por la Casa Blanca. https://bbc.in/3qnSRdlLinks ]

BBC (8/1/2021). Twitter suspende a Trump permanentemente por el "riesgo de mayor incitación a la violencia". https://bbc.in/2LUrSakLinks ]

Burns, A. y Highfield, T. (2015). From News Blogs to News on Twitter: Gatewatching and Collaborative News Curation. En S. Coleman y D. Freelon (eds.), Handbook of Digital Politics (pp. 325-339). Nueva York: Routledge. [ Links ]

Canavilhas, J. (2011). Del gatekeeping al gatewatching: el papel de las redes sociales en el ecosistema mediático. Disponible en: https://bit.ly/2whYTpdLinks ]

Cohen, S. & Hamilton, J.T. (2011). Computational journalism. Comunications of the ACM, 54(10), 66- 71. http://doi.org/cn4t4z [ Links ]

Colle, R. (2013). Prensa y "Big Data": El desafío de la acumulación y análisis de datos. Revista Mediterránea de Comunicación, vol. 4, nº 1. https://bit.ly/38PeHkiLinks ]

Colle, R. (2017). Algoritmos, grandes datos e inteligencia en la red. Una visión Crítica. Colección Mundo Digital deRevista Mediterránea de Comunicación. Disponible en: https://bit.ly/2TbCIKsLinks ]

Colle, R. (2019). Los contenidos de las comunicaciones digitales. INCOM-Chile, Asociación Chilena de Investigadores en Comunicación. https://bit.ly/3nMeS3VLinks ]

Conde, M.A.; Pullaguari, K. P. y Prada, O.A. (2019). Comparativa de la competencia mediática en comunicación política vía Twitter durante las campañas electorales de candidatos presidenciales en España, Ecuador y Colombia. Contratexto, (32), 41-70. http://doi.org/dx78 [ Links ]

Coobis (19/5/2019). Influencia real en Twitter: Cómo medirla correctamente. https://bit.ly/2LUgZ8qLinks ]

Daniel, B. K. (2010) Handbook of Research on Methods and Techniques for studying virtual communities: Paradigms and Phenomena. http://doi.org/cnsjmh [ Links ]

De Uribe, C.; Pascual, J.M.; y Gascón, J.F.F (2016). El liderazgo político en la era digital. Un análisis de uso de Twitter por el papa Francisco (@Pontifex). Obra digital: revista de comunicación, (11), 85-99. http://doi.org/dx8v [ Links ]

Del Río, G. (compiladora) (2018). La cultura de los datos. Actas del II Congreso Internacional de la asociación Argentina de Humanidades Digitales. https://bit.ly/3bF5NrjLinks ]

Diakopoulos, N. (2015). Algorithmic accountability: Journalistic investigation of computational power structures. Digital Journalism, 3(3), 398-415. http://doi.org/gc5t4g [ Links ]

English, F. y Underwood, T. (2016), «Shifting Scales: Between Literature and Social Science», Modern Language Quarterly, 77.3, pp. 278-295. http://mlq.dukejournals.org/content/77/3/277.fullLinks ]

Figueira, Á. & Guimarães, N. (2017). Detecting Journalistic Relevance on Social Media: A two-case study using automatic surrogate features. In Proceedings of the 2017 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining 2017 (pp. 1136-1139). http://doi.org/dx79 [ Links ]

Gómez, M.E. (2014). Manual imperfecto para políticos en tiempo irreal. Tesis Doctoral en Ciencias de la Comunicación. Universidad de La Habana. [ Links ]

González, J.A; Hurtado, Ll. F.; Pla, F. (2018). ELiRF-UPV en TASS 2018: Análisis de Sentimientos en Twitter basado en Aprendizaje Profundo. TASS 2018: Workshop on Semantic Analysis at SEPLN, septiembre 2018, págs. 37-44. [ Links ]

Gruzd, A., Wellman, B., & Takhteyev, Y. (2011). Imagining Twitter as an imagined community. American Behavioral Scientist, 55(10), 1294-1318. Disponible en: https://bit.ly/2IbDnFuLinks ]

Hermida, A., & Young, M. L. (2017). Finding the data unicorn: A hierarchy of hybridity in data and computational journalism. Digital Journalism, 5(2), 159-176. [ Links ]

Hernández, D. I. (2017). Irony and sarcasm detection in Twitter: The role of affective content. Tesis doctoral. Universidad de Valencia [ Links ]

Heuser, R. y Le-Khac, L. (2012): A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method. Stanford Literary Lab. Stanford Lit. Lab, Mayo 2012, [01/09/2012]. Pamphlet 4. [ Links ]

Hine, C. (2011).Etnografía virtual. Editorial UOC. [ Links ]

Hootsuite (2020). Más de 4 mil millones de usuarios en redes sociales de todo el mundo. https://bit.ly/35HcQfcLinks ]

Lim, W. M. (2018). Demystifying neuromarketing.Journal of Business Research,91, 205-220. http://10.1016/j.jbusres.2018.05.036 [ Links ]

Liu, A. (2013). The Meaning of the Digital Humanities», en PMLA, 128, 2, 409-423, https://escholarship.org/uc/item/5gc857twLinks ]

Mancera, A. y Pano, A. (2013 a). El discurso político en Twitter. Madrid: Editorial Anthropos. [ Links ]

Mancera, A., Pano, A. (2013 b): Nuevas dinámicas discursivas en la comunicación política en Twitter. Círculo de Lingüística Aplicada a la Comunicación, 56, pp. 53-80. Disponible en: https://bit.ly/38jBGR2Links ]

Manovich, L. (2006) El lenguaje en los nuevos medios de comunicación: la imagen en la era digital - 1° ed. - Buenos Aires , Paidós. [ Links ]

Marín, A.F y Quintero, J.M. (2018). Confianza en el proceso de paz en Colombia en Twitter.Revista Mexicana de sociología. 80 (11), 115-137. [ Links ]

Martínez, J.J. (2017). Minería de opiniones mediante análisis de sentimientos y extracción de conceptos en Twitter. Tesis de Maestría. Universidad Complutense de Madrid: España. [ Links ]

Melo, J.A. y Gayol, V. (2017). Presente y perspectivas de las humanidades digitales en América Latina. Actualité de la Recherche débats, Nouvelle série, 47 (2), 281- 284. http://10.4000/mcv.7907Links ]

Méndez, M. D. R. R., & Aguilar, G. A. (2015). Etnografía virtual , un acercamiento al método ya sus aplicaciones.Estudios sobre las culturas contemporáneas,21(41), 67-96. https://bit.ly/2XGGv3XLinks ]

O´Halloran, K.L (2012). Análisis del discurso multimodal. ALED 12 (1). p. 75- 97. Disponible en: https://bit.ly/388YJh3Links ]

Ortega, R. Fonseca, A. Gutiérrez, E. Montoyo, A. (2013). SSA-UO: Unsupervised Twitter Sentiment Analysis Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Seventh International Workshop on Semantic Evaluation (SemEval 2013), pages 501-507, Atlanta, Georgia, June 14-15, 2013. c 2013 Association for Computational Linguistics. [ Links ]

Oviedo, A. I. y Velez, G.L. (2016). Minería multimedia: hacia la construcción de una metodología y una herramienta de analítica de datos no estructurado. Revista Ingenierías Universidad de Medellín, vol. 16, No. 31 pp. 125-142 ISSN 1692-3324julio-diciembre de 2017/272 p. Medellín, Colombia. 10.22395/rium.v16n31a6 [ Links ]

Parodi, G. (2008). Lingüística de corpus: una introducción al ámbito. RLA. Revista de lingüística teórica y aplicada, 46(1), 93-119. http://dx.doi.org/10.4067/S0718-48832008000100006 [ Links ]

Pérez, E.; Haber, Y. y Duvergel, M. (2016). Herramientas para el estudio del Nuevo periodismo electrónico o de medios sociales. La perspectiva de framing y análisis crítico discursivo de las etiquetas #The5Free, #Los5Libres y #TodosSomosAmericanos. Estudios sobre el mensaje periodístico, 22(2). http://doi.org/dx8k [ Links ]

Pérez, E.; Haber, Y.; Díaz, J. y Zamora, L. (2017). Un modelo periodístico. Interrelación teórica del Nuevo periodismo electrónico y la plataforma Twitter, en el escenario mediático latinoamericano. Perspectivas de la Comunicación, 10(1), 157-186. https://bit.ly/3aYBIyWLinks ]

Ramírez, A.C. (2017). Polaridad en redes sociales y principales indicadores financieros del sector asegurador. Escuela Colombiana de Ingeniería Julio Garavito, Bogotá, Colombia. https://bit.ly/3hcrEXjLinks ]

Reyes, A. (2012). Linguistic-based Patterns for Figurative language Processing: The Case of Humor Recognition and Irony Detection. Universidad de Valencia, España. https://bit.ly/3dRDZ1cLinks ]

Reyes, J.A.; Paniagua, F. y Sánchez, L. (2017). Minería de opiniones centrada en tópicos usando textos cortos en español. Research in Computing Science, 134, 151-162. http://doi.org/dx8m [ Links ]

Rodríguez, K. y Haber, Y. (2017). La influencia social de los medios de comunicación en Twitter. Enunciación, 22(1), 97-108. http://doi.org/dx8n [ Links ]

Rodríguez, K. y Haber, Y. (2020). Análisis de sentimientos en Twitter aplicado al #impeachment de Donald Trump. Revista Mediterránea de Comunicación/Mediterranean Journal of Communication, 11(2), 199-213. https://www.doi.org/10.14198/MEDCOM2020.11.2.23 [ Links ]

Sánchez, M. (2014). El Big Data como fenómeno y herramienta para la e-Research en entornos infosaturados y complejos). En: Ciencias Sociales y Humanidades Digitales Técnicas, herramientas y experiencias de e-Research e investigación en colaboración CAC, Cuadernos Artesanos de Comunicación /61. Sociedad Latina de Comunicación Social. http://www.cuadernosartesanos.org/#61Links ]

Scolari, C. (2008).Hipermediaciones: elementos para una teoría de la comunicación digital interactiva. Editorial Gedisa. [ Links ]

Scolari, C. A. (2018). Las leyes de la interfaz: Diseño, ecología, evolución, tecnología. (Vol. 136). Editorial Gedisa. [ Links ]

Suau, G; Percastre, S.J.; Palá. G. y Pont, C. (2017). Análisis de la comunicación de emergencias en Twitter. El caso del ébola en España. En Uso y aplicación de las redes sociales en el mundo audiovisual y publicitaria (pp. 119-130). McGrawhill Education. https://bit.ly/2SvpPtNLinks ]

Sykes, J. M. (2011). Ciberpragmática 2.0: Nuevos usos del lenguaje en Internet [Cyberpragmatics 2.0: New Uses of Language on the Internet]: Francisco Yus, 2010. https://doi.org/10.1016/j.pragma.2011.03.009 [ Links ]

TweetBinder (s/f). Alcance e impresiones en Twitter - ¿Qué son y cómo se calculan? https://bit.ly/38KhZoELinks ]

Vallejo, A. M. (2018). Comunicar emociones en el discurso metapolítico de Twitter: el caso de #Maduro versus @NICOLASMADURO. Observatorio (OBS) , 12(3), 175-194. http://doi.org/dx8p [ Links ]

Vállez, M., & Codina, L. (2018). Periodismo computacional: evolución, casos y herramientas. El profesional de la información (EPI), 27(4), 759-768. Disponible en: https://bit.ly/2PFiYMWLinks ]

Van Hee, C.(2017) Can machines sense irony?. Tesis Doctoral. Universidad de Gante. [ Links ]

Ventura, A.S. (2016). Argumentación y discurso político en Twitter. Análisis de la campaña presidencial argentina 2011. Aposta. Revista de Ciencias Sociales, núm. 69, p. 39-66. Luis Gómez Encinas ed. Móstoles, España. Disponible en: https://bit.ly/2I8t4SDLinks ]

Verbeke, M., Berendt, B., d’Haenens, L., & Opgenhaffen, M. (2017). Critical news reading with Twitter? Exploring data-mining practices and their impact on societal discourse. Communications: 42 (2). p. 127-149. Disponible en: https://bit.ly/2PAmpV5Links ]

Vilares, D.; Alonso, M.A. y Gómez, C. (2013). Una aproximación supervisada para la minería de opiniones sobre tweets en español en base a conocimiento lingüístico. Procesamiento del Lenguaje natural, 51, 127-134. https://bit.ly/3c1Et3YLinks ]

Vilariño, D.; Zepeda, C.; Sanzón, Y.M., Carballido, J.L.; Medina, C.; Flores, G. (2015) Aplicación del modelo Léxico-Sintáctico para detectar la polaridad de opiniones sobre profesores. Pistas Educativas, No. 113, octubre 2015. México, Instituto Tecnológico de Celaya. [ Links ]

Ward, J. & Barker, A. (2013), «Undefined By Data: A Survey of Big Data Definitions». https://arxiv.org/abs/1309.5821Links ]

Zappavigna, M. (2011). Ambient affiliation: A linguistic Perspective on Twitter. New Media & Society, 13(5), 788-806. https://bit.ly/32Df7FELinks ]

Notas aclaratorias

aUn grafo es una unidad grupal que relaciona nodos conectados a través de aristas. En el caso particular se refiere a las relaciones sociales que se dan entre los usuarios de la comunidad virtual y sus vías de enlace.

bPolaridad: es un valor que se le asigna a un término que expresa opinión dependiendo del significado lingüístico de la palabra y se basa en metodologías de análisis de los sentimientos o minería de opiniones. El valor de la polaridad puede variar entre diferentes rangos entre ellos negativo, neutro y positivo (Ramírez, 2017: 47).

cEl Machine Learning es una disciplina del campo de la Inteligencia Artificial que, a través de algoritmos, dota a los ordenadores de la capacidad de identificar patrones en datos masivos para hacer predicciones, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan a largo plazo y los desarrolladores mejoren los algoritmos.

dInfluencia: Se define la influencia en Twitter como el potencial de una acción (retweet, respuesta, me gusta, etc) de un usuario para iniciar una acción adicional por parte de otro usuario. Comprender el término acción en su relación con la influencia en Twitter depende de la estructura fundamental de las ideas en el entorno.

eAlcance: Como en el caso del impacto, esta métrica en otras herramientas se llama audiencia. Se refiere a los usuarios únicos que potencialmente han visto la publicación. Vuelve a ser un dato potencial ya que no es posible garantizar que todos los usuarios efectivamente hayan estado conectados para ver el tweet. El alcance que un tweet puede medirse de manera más efectiva gracias al número de retweets, clicks o menciones que este tenga en el resto de los comentarios que

eNivel de participación: Las tasas de participación son métricas que hacen el seguimiento respecto a qué tan involucrado está tu público con tu contenido de manera activa, también se le conoce como engagement. Los consumidores comprometidos interactúan con las marcas a través de “me gusta”, comentarios y la función de compartir contenido en redes sociales.

Recibido: 15 de Enero de 2021; Aprobado: 20 de Febrero de 2021

*Autor para la correspondencia: karines@uo.edu.cu

Los autores declaran que no existe conflicto de intereses.

Los autores participaron por igual en la investigación: conceptualización, diseño metodológico, escritura, análisis de encuestas, interpretación de resultados, conclusiones, recomendaciones, etcétera.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons