Introducción
El principal hito que facilitó la cohesión de las humanidades digitales como materia fue la evolución y desarrollo de la interfaz gráfica del usuario. Con ello la capacidad de manipular la información textual, cuantitativa, gráfica, geográfica, audiovisual o multimedia para la investigación humanística se hizo patente y contribuyó al aprovechamiento de herramientas computacionales. (Melo y Gayol, 2017: 282).
La mayoría de los autores hablan de Humanidades Digitales desde un punto de vista propositivo, no se hablan de teorías generalistas en torno al tema, se trata de una relación transdisciplinar, aún exploratoria, aunque cambiante como los procesos digitales en línea.
Los métodos estadísticos e informáticos, y otros métodos de las ciencias sociales, se han transformado y han sabido adaptar sus modelos conceptuales a la complejidad de los textos (English y Underwood, 2016). Desde el año 2011 la expresión «Big Data» se ha extendido en las ciencias experimentales y los medios de comunicación como si el incremento de los datos disponibles fuera la próxima revolución científica. (del Rio Riande, 2019)
La definición clásica de «Big Data» consta de una fórmula fácil de entender y memorizar -las tres V-: el Volumen (Terabytes, Petabytes, Exabytes), la Velocidad (datos en continua generación) y la Variedad (textos, imágenes, sonidos) (Ward y Barker, 2013).
Las humanidades digitales ponen su acento en la naturaleza cultural de los datos, con la expansión de las redes sociales y otras plataformas de social media, sus lenguajes, sin los cuales no se entendería el auge del Big Data, vienen siendo usados en un número creciente de aplicaciones (Sánchez, 2014) que facilitan las búsquedas y actividades investigativas a través de filtros y métricas de fácil manejo.
Este principio se puede llamar la “estructura fractal de los nuevos medios”. De la misma manera que un fractal posee la misma estructura a diferentes escalas, el objeto de los nuevos medios presenta siempre la misma estructura modular. Los elementos mediáticos, ya sean imágenes, sonidos, formas o comportamientos, son representados como colecciones de muestras discretas (píxeles, polígonos, vóxeles, caracteres o scripts), unos elementos que se agrupan en objetos a mayor escala, pero que siguen manteniendo sus identidades por separado. (Manovich, 2006:9) Se vuelve posible separar el nivel del «contenido» (los datos) del de la interfaz. (Manovich, 2006:13)
En este sentido se han manifestado presupuestos teóricos propios de las ciencias blandas en los espacios online. Así por ejemplo la comunicación adopta teorías ya formuladas como el crowdsourcing o el gatewatching (Canavilhas, 2011; Burns y Highfield, 2015), mientras que se ajustan metodologías como la lingüística de corpus (Martínez, 2015), análisis del discurso multimodal (O´Halloran, 2012), análisis de big data (Colle, 2017), análisis de redes sociales (Aguirre, 2011), minería de datos (Baeza, 2009), estudios etnográficos del usuario (Hine, 2011; Méndez y Aguilar, 2015), ciberpragmática (Sykes, 2011), sociología de la tecnología (Aibar, 1996; Aguiar, 2002) , neuromarketing (Lim, 2018), semiótica de las interfaces (Scolari, 2018), hipermediaciones (Scolari, 2008), entre otras.
No obstante, debemos a otras ciencias la proposición de metodologías útiles de estudio como el análisis de redes sociales, la minería de datos (análisis de sentimientos, grafos1, polaridad2, multimedia); mientras que nuestras propias materias adaptan sus modelos metodológicos a las nuevas circunstancias contextuales como lo ha hecho por ejemplo el análisis del discurso multimodal en los espacios marcador por ejemplo por estructuras narrativas hipertextuales y multisoportes.
El problema metodológico general de las humanidades digitales puede ser planteado de manera muy simple y muy clara: ¿cómo pasamos de los números a los significados? Los objetos que se investigan, las pruebas que se recogen, las formas en que se analizan, todo eso es cuantitativo. Cómo pasar de este tipo de evidencias y de objetos a argumentos cualitativos y a reflexiones sobre temas (Heuser y Le-Khac,2012: 46); estas cuestiones se desarrollan de manera cualitativa al detectar patrones que dan lugar a resultados en mejoramiento continuo; sobre todo desde la perspectiva del aprendizaje automatizado (machine learning3).
Varios autores en el campo de la comunicación, aunque no han hablado sobre humanidades digitales propiamente dicha, han propuesto herramientas útiles en la materia. Así por ejemplo:
Propuestas teórico metodológicas para el uso de softwares, algoritmos matemáticos y enfoques propios de ciencias cibernético-informáticas para la detección de patrones (Colle 2013, 2017, 2019; Daniel, 2010; Cohen y Hamilton, 2011; Mancera y Pano, 2013a, 2013b; Diakopoulous, 2015; Coddington, 2015; Arcila, Barbosa y Cabezuelo, 2016, Pérez 2016, 2017; Hermida, 2017; Vallez y Codina, 2018; Conde et al, 2019; Rodríguez y Haber, 2020).
Uso de la minería de textos (Zappavingia, 2011; Reyes, 2012; Vilares et al, 2013; Ortega et al, 2013; Abascal, 2014; Almgrem y Olssom, 2015; Vilariño, 2015; Verbeke et al, 2017; Figueira y Guimarães, 2017, Hernández, 2017; Van Hee, 2017; Reyes, 2017; Martínez, 2017; Rodríguez y Haber, 2017; Gonzalez et al 2018; García et al, 2019).
Análisis cualitativo para la detección de valores afectivo emocionales (Gómez, 2014; Ventura, 2016, Marín, 2018)
Propuesta de uso de herramientas o técnicas mixtas (cuantitativas y cualitativas) para la detección de sentimientos y afectos (De Uribe, 2016; Suau, 2017; Baviera, 2017; Vallejo, 2018; Aguirre et al, 2018).
La lista pudiera ser interminable, aunque la mayoría de las investigaciones se concentran en la red social Twitter, probablemente porque es una de las más abiertas, de la que existen más aplicaciones para procesamiento de datos y un apartado específico para desarrolladores que permite una extracción gratuita del contenido de los tweets de los últimos 7 días. Así mismo, los autores, se dedican mayoritariamente al estudio de los textos probablemente porque el machine learning está más avanzado informáticamente en ese aspecto, aunque lo asociado con las imágenes y videos atraviesa un análisis más complejo pese a ser la mayor parte del contenido disponible en Internet (Oviedo y Velez, 2016).
El informe de investigación tuvo como objetivo caracterizar el discurso emitido bajo el hashtag #ElectionsUSA utilizando las aplicaciones de minería de datos Stela y Brand 24, además del análisis del discurso multimodal.
Métodos
Contexto situacional: #ElectionsUSA
Twitter es una de las redes sociales más utilizadas por los usuarios en Internet, según los últimos datos estadísticos publicados por Hootsuite (2020) cuenta con alrededor de 353 millones de usuarios activos. Es también una de las más utilizadas con fines políticos y propagandísticos.
En este sentido analizamos uno de los tweets más relevantes asociados a las elecciones para el 46 presidente de los Estados Unidos, las mismas fueron realizadas el 3 de noviembre de 2020 en un contexto marcado por la crisis sanitaria del coronavirus y un previo juicio político de impeachment al presidente saliente. Uno de los espacios más utilizados de manera directa por Trump fueron sus dos cuentas verificadas de Twitter @realDonaldTrump y @POTUS para difundir un posible fraude en el proceso eleccionario luego de que Joe Biden fuera declarado ganador sobrepasándole por más de 7 millones y tras haber obtenido mayor número de votos electorales. El 8 de enero de 2021 la BBC publica la suspensión permanente en Twitter de las cuentas pertenecientes a Trump por el riesgo de mayor incitación a la violencia tras el ataque de manifestantes al capitolio.
Durante el mes de noviembre tuvieron lugar numerosas discusiones por parte de las comunidades virtuales en Twitter en torno a las votaciones y elecciones presidenciales, asunto que ofrece una perspectiva descriptiva de los encuadres adoptados por los usuarios durante y en el momento de las declaraciones.
Problema de investigación: ¿Cuáles fueron los encuadres discursivos de los usuarios en Twitter con el hashtag #ElectionsUSA?
Objetivo: Caracterizar los encuadres discursivos de los usuarios en Twitter con el hashtag #ElectionsUSA
El presente informe de investigación es de vital importancia para entender la producción de los usuarios en comunidades virtuales, las estructuras sociales que dan lugar a la distribución del discurso sobre #ElectionsUSA. Nos permite acercarnos a apartados tan necesarios de estudio en la comunicación y humanidades como las representaciones simbólicas de la opinión pública, las relaciones sociales en el microblogging y el desarrollo productivo del contenido por parte de los usuarios, que incluye actividades como la publicación de memes, contenido gráfico y videos. Así mismo muestra en la práctica la aplicación de técnicas y métodos de enfoque mixto como la minería de datos y el análisis del discurso multimodal, metodologías en apogeo en las ciencias humanísticas de los últimos tiempos.
Diseño de investigación
La investigación fue descriptiva de enfoque mixto. La metodología principal utilizada fue el análisis del discurso multimodal, un paradigma emergente en el campo de los estudios del discurso que amplía el estudio del lenguaje per se al estudio del lenguaje en combinación con otros recursos (O´Halloran, 2012: 75), útil ante la cualidad multisoporte de los mensajes en Twitter.
Además, se utilizó la minería de datos (textos, grafos, y multimedia) para la sustracción y filtrado de los textos publicados bajo el hashtag #ElectionsUSA. Según Baeza-Yates (2009) la minería de datos en redes sociales funciona con utilidad en la determinación de percepciones. El concepto de minería de datos o data mining agrupa técnicas computacionales que permiten descubrir informaciones poco, especialmente características que relacionan de un modo inesperado - o difícil de descubrir - los valores de múltiples variables en una gran cantidad de registros.
“La minería de datos no elimina la participación humana, los métodos son variados y el software existente incluye habitualmente una “batería” de programas que operan de distintas maneras y entregan distintos tipos de resultados, en su mayoría acompañados de formas visuales destinadas a poner en evidencia las relaciones descubiertas” (Colle, 2017).
La guía de análisis se aplicó sobre una muestra o corpus total de 13 661 tweets sustraídos a través de la plataforma Stela para determinar la polaridad y filtrar los tweets y usuarios más mencionados e influyentes en la conversación en el microblogging. A través de Stela extrajimos gratuitamente el histórico de sus mensajes de los últimos 7 días a través de la interfaz de programa de aplicación (API) de Twitter (REST y Streaming), recurso gratuito. Utilizamos además la aplicación disponible en la web Brand24 que facilitó reconocer la influencia4, alcance5, y nivel de participación6 de los usuarios que mostramos en el siguiente apartado.
Se aplicó un análisis más específico a aquellos tweets con mayor influencia, cuyo autor fuera más mencionado o tuviera mayor alcance para reconocer los principales encuadres distribuidos por la comunidad virtual. Los tweets sustraídos se encontraban en los idiomas inglés, francés, portugués y español y se les aplicó la siguiente guía de análisis:
Total de tweets analizados
Polaridad del total de tweets
Palabras más repetidas en el cuerpo de los tweets
Días de mayor actividad
Menciones más populares y sus encuadres.
Perfiles públicos más activos
Perfiles más influyentes.
Contenido y temáticas más tratadas en los tweets de los perfiles más activos y más influyentes.
Cambios en la dirección del tema central #electionsUSA o tratamiento de temáticas asociadas de manera aislada.
Uso de recursos multimediales en el total de tweets y su encuadre.
Desarrollo
Total de tweets analizados: 13 661
Se seleccionó una muestra general de 13 661 tweets publicados en el mes de noviembre de 2020, sustraídos por el software Stela de manera aleatoria. Sobre los mismos se aplicó el análisis de la polaridad (Figura 1), de este corpus total también se sustrajo las palabras más repetidas y los días de mayor actividad. Los tweets de la muestra sustraída fueron publicados en idioma inglés, español y francés.
Palabras más repetidas en el cuerpo de los tweets
En este orden (empezando por la más utilizada según el software Stela) las 10 palabras más repetidas fueron: #electionsUSA, elections2020, Trump, fraude, joebiden, giuliani, fraudeselection, Donald, president, electionday.
Días de mayor actividad (fuente: Stela)
Del 1 al 5 y del 8 al 11 de noviembre de 2020 que coincide con la fecha de votaciones y la cercanía a los resultados generales emitidos sobre el ganador de las elecciones norteamericanas.
Menciones más populares y sus encuadres
@HaroldTribune_ (19 de noviembre de 2020, traducido del francés): Rudy Giuliani da una conferencia de prensa: 200 declaraciones de agentes electorales sobre el fraude. Se alega que los demócratas han hecho trampa en Pennsylvania, Michigan, Georgia. El objetivo: descertificar los resultados comunicados anteriormente. "300.000" votos falsos en Detroit. Sus propias hiperextrapolaciones #ElectionsUSA
El anterior tweet se encuadra en las hiperextrapolaciones por parte del presidente Trump para aseverar la existencia de un fraude. Es importante reconocer como el autor (periodista francés) utiliza recursos como las comillas para denotar la falsedad de la noticia. De la muestra fue uno de los que más reacciones contempla, obteniendo respuestas asociadas a contrarrestar tal afirmación a manera de negatividad: @NonBinaire: ¿Y si no son hiperextrapolaciones?, @wissam82172356: Las deposiciones de los funcionarios electorales no son técnicamente hiperextrapolaciones en los tribunales.
@Mwcartoons (traducido del inglés, 22 de noviembre del 2020): Peleando en una batalla perdida. Ha perdido la cabeza de todas formas. (Gracias Nool Kooij por la idea) #trump, #pence #mikepence #donaldtrump #republicans #donquixote #donquichotte #elephant #uselections #elections2020 #electionsusa @cartoonmovement @cartooningPeace @Joop_nl (Fig. 2)
@galilea_arg (19 de noviembre del 2020): #FilmameEstoNestor #Minas en la #CasaBlanca por @Julaju y @palolauahiba Podés leer la nota completa en: galilea.ar/2020/11/filmam… #EleccionesEEUU #ElectionsUSA #TheSquad #KamalaHarris #SarahMcBride #WhiteHouse El tweet original en español ofrece un enlace a un trabajo periodístico sobre las minas, es decir mujeres o miembros de la comunidad LGBTIQ+ que han ocupado un escaño en la Casa Blanca y el senado durante las elecciones norteamericanas de 2020; entre estas menciona a Kamala Harris, Teresa Leger Fernández y Deb Haaland por Delaware, Sarah McBride, la primera senadora transgénero en Estados Unidos, y la republicana Cynthia Lummis que fue electa la primera mujer senadora por Wyoming. La cuenta que emite el tweet se califica como periodismo alternativo, de transformación social y feminista y está geolocalizado en Córdoba, Argentina.
@studioandydna (19 de noviembre de 2020, traducido del inglés): George #Soros es el mayor donador al #Antifa & #BLM - Rudy #Giuliani #Election2020
Pertenece según la descripción su bio a un artista visual contemporáneo de nacionalidad suiza y, en este caso, enmarca a George Soros en la conversación en el microblogging sobre las elecciones del 46 presidente norteamericano, aunque no explicita en qué sentido incluye a esta figura pública.
Comparte a la misma vez un video con más de 61 mil reproducciones donde Soros niega donar dinero a instituciones o gobiernos como el de Venezuela. Aquí podemos considerar el tweet como un cambio en la dirección de la conversación de las comunidades virtuales que siguieron el hashtag #electionsUSA.
@RegisHounkpe (19 de noviembre de 2020, traducido del francés): interglobeconseils.org/blog/pour-la-d… #InterglobeConseils #Geopolitique #electionsUSA
El autor es el director ejecutivo de @InterglobeC, identificada como Empresa de consultoría en conocimientos geopolíticos, cooperación internacional y comunicación estratégica. El tweet es un enlace a un texto periodístico sobre cómo cambiarían las cosas en África de acuerdo a los resultados con la elección de Joe Biden como presidente de los Estados Unidos.
De esto modo inserta la importancia de las elecciones norteamericanas en el contexto y desarrollo global, aunque lo hace de una manera hipermedial en la que la continuidad del mensaje depende del cotexto, es decir del enlace a seguir que publica en el tweet sin aclaraciones específicas sobre el contenido que distribuye.
-@Enfantdabord2 (23 de noviembre de 2020, traducido del francés): #ElectionsUSA: #Trump ¿Cree en su derrota para sorprender mejor a su oponente?
-@LennyFe01716924 (19 de noviembre de 2020): Todavía creo que el presidente @realDonaldTrump no perdió las elecciones… ¿eso es mucha perseverancia? #electionsUSA #Election2020 #trustiinvote #WeAreTrump
- @PSVICE (18 de noviembre de 2020): #FakeElectionsUSA #Elections2020 #ElectionsUSA #BidenGoesToJail Lin Wood, abogado de @realDonaldTrump, sobre las nuevas pruebas: “@JoeBiden va a ir a la cárcel” - Libertad Digital.
Contenido y temáticas más tratadas en los tweets de los perfiles más activos y más influyentes
En el total de tweets la mayoría de los temas se refieren más que al triunfo de Biden a la derrota de Trump desde diferentes perspectivas polarizadas, siendo este último el punto principal de la conversación en la muestra analizada. En algunos casos se etiqueta a Biden pero el punto central de la conversación responde a la figura de Trump.
La defensa de Trump por los usuarios desde Twitter, por un lado, asume un apoyo desmedido fundamentalmente de usuarios comunes no vinculados a instituciones mediáticas y por otro con una aprobación del asunto como fraude siguiendo y citando las propias palabras de @realDonaldTrump. Otras publicaciones del lado contrario defienden a cabalidad la idea de una hiperreacción exagerada del mandatario saliente ante la derrota, así, por ejemplo:
@fvallois: (5 de noviembre de 2020, traducido del francés): Estas elecciones de EE.UU. nos permiten (re)honrar dos términos aprendidos: - "Ipsedixis": la tendencia a tomar todas las palabras de una figura de autoridad como verdaderas. (#Trump) - "Ultracrepidarianismo": la tendencia a hablar con confianza sobre temas que no conoces (#Twitter)
@fvallois: (8 de noviembre de 2020, traducido del francés) Un pequeño inconveniente en la portada francesa de #ElectionsUSA, además muy interesante: la presencia insuficiente de psicólogos en los platós para intentar comprender las reacciones irracionales de #Trump.
@fogiesbert (12 de noviembre de 2020, traducido del francés): FOG - El fenómeno del triunfo o el gran fracaso mediático. Sólo porque el ex presidente esté histérico no significa que la prensa deba ponerse histérica https://lepoint.fr/tiny/1-2400521 #FOG vía @LePoint #Medios de comunicación #eleccionesUSA
Así mismo se muestra en los tweets un desconcierto o espera respecto a la resolución y análisis del posible fraude y de la información sobre los resultados finales.
@Ticia166 (27 de noviembre de 2020, traducida del francés) Esperamos con interés la fecha del 14 de diciembre, para que finalmente se pueda arrojar luz sobre estas #eleccionesusa que los #electores de @JoeBiden no te alegres demasiado rápido. @POTUS no ha dicho su última palabra.
@USPressCorpsPR (24 de noviembre de 2020, traducido del inglés): Trump finalmente acepta la transición de Biden pero aún así se niega a ceder (VIDEO) El presidente electo de los Estados Unidos, Joe Biden, ha recibido formalmente el visto bueno para comenzar su transición a la presidencia. #EleccionesEEUU https://youtu.be/n6o4Cu4evdI a través de @YouTube
@CLSIOGOMES3 (5 de noviembre de 2020, traducido del portugués): ¿Cómo puede haber fraude electoral en la mayor democracia del mundo, Sr. Trump? ¿Qué "sanciones deberían imponer los países africanos a los Estados Unidos"? Sí, porque si eso ocurriera en África, a mediados de 2020, las tropas y los misiles ya estarían listos para el ataque
@BVoltaire (6 de noviembre de 2020, traducido del francés): [ENTREVISTA DE AUDIO] @andrebercoff Es indiscutible que hubo fraude en el voto por correo, la disputa debe resolverse antes de que se anuncie el resultado" Flecha hacia la derecha https://bvoltaire.fr/andre-bercoff-cest-incontestable-quil-y-a-eu-fraude-dans-le-vote-par-correspondance-le-contentieux-doit-etre-regle-avant-la-proclamation-du-resultat/ #El día de las elecciones en EE.UU., triunfo, bendición de las elecciones, fraude...
Cambios en la dirección del tema central #electionsUSA o tratamiento de temáticas asociadas de manera aislada.
En el conjunto de la muestra el tema central giró en torno a la elección del presidente, sin embargo, hubo temas que se aislaron del tema central que seguía la comunidad virtual:
Relación entre la derrota de Trump y la elección de Biden con el desarrollo y cambios en el continente africano.
Temas asociados con la elección del senado y miembros elegidos que forman parte de la comunidad LGBTIQ+ o que son mujeres que por primera vez ocupan un escaño importante de manera histórica,
Inserción del nombre de George Soros en relación con la etiqueta #ElectionsUSA.
Derechos humanos de los afroamericanos en Estados Unidos.
Uso de recursos multimediales en el total de tweets y su encuadre.
Un 28 % de los Tweets publicados analizados en la muestra contenían imágenes o videos según el software Stela. De ellos la mayoría completaban la información del texto del tweet o denotaban un contenido independiente por lo que son totalmente necesarios para entender el sentido ofrecido por el usuario en el contexto. Los más utilizados fueron memes o referencias gráficas.
El más mencionado lo podemos encontrar en el apartado 1 del análisis de los resultados donde @Mwcartoons coloca a Trump como Don Quijote y a Pence como Sancho Pansa en un intento por seguir su lucha contra los molinos de viento, una forma de relación intertextual con el pasaje de Don Quijote. Otro usuario que asumió una representación simbólica usando elementos gráficos fue @lectrr quien muestra un infomapa donde el color rojo muestra los estados ganados por Trump y el azul las fake news. Otro gráfico de este último autor presenta a Biden, y Kamala Harris indicando el estado al que pertenecen y a Donald Trump como estado de negación; es importante mencionar que este usuario no adopta una postura directa en torno a aceptar o denegar el resultado de las elecciones, solo presenta las imágenes sin asumir una polaridad determinada de manera denotada en el contenido escrito del tweet.
Consideraciones finales
Los encuadres bajo el hashtag #ElectionsUSA estuvieron dirigidos a la figura de Donald Trump como el punto principal y la detección del tema del fraude de las elecciones como uno de los temas más comentados. Aunque algunos autores defendieron una hiperreacción ante la posición trumpista denotamos una elevación de la figura pública en el discurso y se dio una mayor importancia a su derrota que a la propia elección del presidente Joe Biden. El caso de estudio presentado muestra resultados imposibles de obtener sobre tan abundante contenido de datos sin la utilización de métricas y programas de apoyo.
Tal y como mostramos en el análisis de los resultados el uso de recursos como el clustering , el análisis de la identidad de los usuarios, la revisión automática de hipertextos e imágenes es una exigencia de las investigaciones contemporáneas en humanidades y comunicación. Tareas propias de la data mining como la recuperación de información, análisis, interpretación, detección de patrones se hacen imprescindibles en las humanidades digitales en las cuales podemos alcanzar además un mayor grado de fiabilidad sobre grandes volúmenes de datos disponibles de auditar. De ahora en adelante las humanidades digitales han de ser pensadas en dos aspectos: la interdisciplinaridad que supone su basamento teórico metodológico y la necesidad de softwares especializados en sus investigaciones.
Aunque se vaticina una cierta decadencia de las humanidades, estas no hacen más que adaptarse a las modificaciones impuestas por el desarrollo de las tecnologías y a las facilidades que impone el desarrollo de las aplicaciones. “Ya estamos viendo que el mayor desafío a la hora de desarrollar métodos digitales de humanidades puede que no sea cómo extraer datos de objetos humanísticos, sino cómo analizar esos datos de manera significativa e interpretable (Heuser y Le-Khac, 2012: 4)”. Los avances de los desarrolladores y el machine learning proporcionan un marco adecuado de integración, y abren nuevas perspectivas en el estudio de las humanidades digitales.