Introducción
La Red de Indicadores de Ciencia y Tecnología (RICYT), instancia encargada a nivel regional de analizar el comportamiento de las investigaciones científicas y tecnológicas, publicó como algo inusual, el estallido e incremento de publicaciones científicas alrededor de la pandemia causada por la COVID-19.1 La experiencia científica de los últimos meses frente a la actual pandemia muestra celeridad inédita en la divulgación de las investigaciones. Se trata de un comportamiento que muestra una verdadera carrera de la ciencia contra la expansión de este letal virus.
En esta carrera de la ciencia, uno de los recursos de información científica que más ha invertido en la aceleración de la socialización de las investigaciones científicas sobre coronavirus, y más específicamente sobre la enfermedad de la COVID-19, ha sido PubMed.
PubMed es un recurso desarrollado por el Centro Nacional para la Información Biotecnológica (NCBI, por sus siglas en inglés), de la Biblioteca Nacional de Medicina de los Estados Unidos, una entidad con rango de Instituto Nacional de Salud, considerado además el recurso bibliográfico gratuito en internet más utilizado en el área de la salud. Cubre los campos de la medicina, la enfermería, la estomatología, la veterinaria, la gestión de salud, las ciencias preclínicas y algunas áreas de las ciencias de la vida. La retrospectividad de su colección alcanza el año 1809. Medline, una de las bases más importantes de PubMed, comprende registros de artículos publicados entre 1966 y el presente; y OldMedline abarca el periodo 1946-1965. Ambos recursos atesoran más de 20 millones y medio de registros (aproximadamente, el 89 % del total reunido por PubMed); apareciendo el 17 de enero de 2020 los primeros artículos sobre COVID-19 en esta gran base de datos.2
PubMed posee grupos de revisión de la Colaboración Cochrane y tiene una tendencia marcada a procesar materiales publicados por revistas de los Estados Unidos, así como en idioma inglés. Aunque también sus búsquedas incluyen referencias bibliográficas, referencias a fuentes que preceden a su fecha de ingreso a la base de datos, referencias a trabajos no cubiertos en Medline; y referencias a manuscritos de autores pertenecientes a los institutos nacionales de salud de los Estados Unidos, publicados en revistas no procesadas por Medline, así como de algunas revistas en ciencias de la vida.
Un aspecto característico de las investigaciones del área de salud es que todo lo que se publica se indiza utilizando los términos MeSH. Esta sigla hace referencia a los «medical subject headings», también conocidos como «encabezamientos de materia médica», «títulos de temas médicos» o «descriptores en ciencias de la salud», utilizados por la Biblioteca Nacional de Medicina de los Estados Unidos (NLM).3) Tal vocabulario controlado lo emplea Medline y otras bases de datos biomédicas.3 Consta de más de 33 000 vocablos ordenados en estructuras jerárquicas llamadas “árboles”, que se revisan anualmente para asegurar que constituyan un fiel reflejo de la práctica y la terminología médica actual.4
Para utilizar los MeSH existe la MeSH Database (base de datos de los MeSH) dentro del portal de PubMed, en la cual se consulta qué términos o palabras son consideradas o incluidas como MeSH, según el concepto que se busque. Este descriptor de documentos contiene una lista actualizada de todos los posibles encabezamientos de materias vigentes,5) lo que facilita la recuperación de la información mediante los términos médicos autorizados y reconocidos por el gremio del colegio médico.
Sin embargo, muy a pesar de todas las prestaciones que facilitan los recursos disponibles para la red de salud, uno de los retos que aún enfrenta gran parte del profesional médico es su escasa cultura en el manejo óptimo de la información científica publicada. Hoy en día se requiere de profesionales de la salud que tengan mayores habilidades infotecnológicas, que le permitan obtener la mayor cantidad de datos e información de las investigaciones médicas que son publicadas mediante artículos científicos.
A partir del contexto temático y servicios que facilita PubMed, junto a las necesidades informativas que tienen los investigadores y profesionales sobre el comportamiento de la enfermedad COVID-19, esta investigación se cuestiona si es posible saber cuáles especialidades médicas se han socializado más mediante este importante recurso de información.
El principal interés científico de este estudio es examinar la información procedente de los campos: materia, MeSH y palabras clave, para describir el comportamiento del dominio temático de PubMed en las investigaciones sobre coronavirus. A partir de esta necesidad científico práctica, esta investigación tiene como objetivo principal analizar el comportamiento temático de los artículos publicados por PubMed sobre coronavirus en el primer semestre del año 2020. Para ello se utilizó como principal fuente de información y de análisis al Observatorio Métrico de Coronavirus de la Universidad de Pinar del Río.
Métodos
El dominio de análisis de esta investigación son los artículos científicos sobre coronavirus publicados por PubMed del 1 de enero al 23 de julio del 2020. La base de datos PubMed, tal y como sucede con otras bases de datos científicas, actualiza de forma constante y sistemática la publicación de artículos; así como la entrada y salida de sus revistas, lo que significa que la consulta a esta fuente puede cambiar de un momento a otro e, incluso, en el mismo día. Por ello, este estudio especifica el día y la hora en que fue realizada la búsqueda y descarga de información.
La única base de datos científica que se utilizó en este estudio fue PubMed, la cual se consultó con los términos MeSH y operadores apropiados el día 23 de julio a las 9:00 am con la siguiente estrategia de búsqueda: 2020/01/01:2020/07/23 [dp] AND ("2019-nCoV" OR HCoVs OR CoVh OR coronavirus OR "HCoV-OC43" OR "HCoV-HKU1" OR "HCoV-NL63" OR "HCoV-229E" OR "MERS-CoV" OR "SARS-CoV" OR "SARS-classic" OR "SARS-CoV-2" OR "SARS-CoV2" OR "covid-19" OR "covid" OR "Middle East respiratory syndrome" OR "Severe acute respiratory syndrome").
Esta consulta generó aproximadamente 40 000 artículos científicos publicados en PubMed hasta ese día y hora.
La herramienta de procesamiento de la información que utilizó este estudio para el análisis métrico de la información procedente de PubMed fue el Observatorio Métrico de Coronavirus de la Universidad de Pinar del Río “Hermanos Saíz Montes de Oca”, el que fue desarrollado por el Grupo de Investigación en Gestión de Información, Conocimiento y Tecnologías (proGINTEC).
La metodología que se aplicó en la investigación fue desarrollada por proGINTEC, y aunque ha sido utilizada por el grupo desde su creación, se ha actualizado en función de los avances de las TIC, la profundidad, alcance y desagregación de los datos, así como de sus aplicaciones. Esta metodología ha sido aplicada en múltiples investigaciones científicas publicadas a nivel internacional.6,7,8,9,10,11,12,13,14,15
Después de realizado el procesamiento y normalización de los artículos publicados en PubMed con el Observatorio Métrico de Coronavirus, solo ingresaron al estudio métrico un total de 34 339 artículos científicos. La diferencia entre los documentos encontrados y los artículos incluidos en el estudio estuvo en que fueron eliminados aquellos que no tuviesen bien estructurados todos sus metadatos, en campos específicos de vital importancia para esta investigación, por ejemplo: año de publicación, palabras clave, título, entre otros.
Resultados
La estrategia de análisis de esta investigación identificó, en un primer momento, a 140 revistas científicas con una alta productividad en el tema objeto de estudio (Fig. 1) destacándose un grupo que tiene más de 200 artículos publicados sobre el tema en el periodo que se analiza.
Las materias trabajadas en relación con el coronavirus son diversas (Fig. 2), lo que muestra el significativo interés de la comunidad científica en su estudio integral.
Al comparar la información del dominio con los términos MeSH asociados a las investigaciones publicadas en PubMed, se corroboró que el mayor número de artículos publicados por esta fuente en el primer semestre del 2020 se corresponden con las diferentes intervenciones de la COVID-19 (Fig. 3). Lo que refleja una mayor cantidad de artículos publicados sobre coronavirus respecto a otras enfermedades e investigaciones médicas.
El análisis de los MeSH conjuntos que aparecen en los artículos reveló que en el periodo de tiempo que se analizó el mayor núcleo de artículos publicados por PubMed se orienta a investigaciones relacionadas con pandemia en humanos y con neumonía viral. Con estos tres términos MeSH se relacionan el resto de las investigaciones temáticas y por especialidades (Fig. 4). El mapeo de los descriptores demostró que el mayor comportamiento de coocurrencias fue 5180 en un ámbito de 30 nodos y el mínimo 158. Las relaciones de estas ocurrencias oscilan entre 1 (mínima) y 29 (máximas). Esta investigación consideró que el alcance de 30 nodos representa de forma diáfana el comportamiento del dominio.
Las palabras clave fueron otro indicador que indican el comportamiento temático de un dominio científico, pero en este caso no desde las taxonomías científicas, sino desde la perspectiva personal del investigador que realiza la investigación y publica el artículo (Fig. 5).
Se analizaron los resultados del indicador cuantitativo “palabras clave por artículos”, (Fig. 5) con el indicador relacional de “palabras clave conjuntas en cada artículo” (Fig. 6).
La figura 6 describe los principales clústeres de las líneas de investigación que más publicaron resultados científicos en el tiempo que se analiza.
En el primer semestre del año 2020 hubo un elevado número de artículos dedicados al surgimiento del virus zoonosis en la ciudad de Wuhan, China, este fue un clúster temático muy bien delimitado en la figura 4.
El clúster más grande del mapa centra el mayor número de investigaciones sobre la pandemia relacionadas con diferentes especialidades médicas, que han sido muy estudiadas por incidir en ellas efectos adversos del virus.
La interpretación del análisis de las palabras conjuntas destaca una gran producción científica en investigaciones orientadas a problemas mentales, depresión, ansiedad, estrés, distanciamiento físico entre otras afectaciones.
Otro clúster representado estuvo relacionado con un grupo de medicamentos muy estudiados, aplicados y cuestionados desde los protocolos de actuación de la enfermedad. Es el caso de la azithromycin, el randomised, la hydroxychloroquine y la chloroquine, independientemente de que existan otros, estos fueron sobre los que más publicó PubMed hasta el momento de la investigación.
Discusión
En el contexto de análisis de esta investigación es importante mencionar que la mayoría de los estudios métricos en este tema se han orientado a su cobertura mundial 16,17, otros se han enfocado a las tendencias de publicación regional 18,19), así como existen estudios que analizan e incluso comparan la producción de publicaciones entre recursos y bases de datos científicas 20,21. Sin embargo, son escasas las investigaciones que analizan el comportamiento temático de las diferentes publicaciones. La presente investigación trabaja en esa brecha, se orienta a conocer no solo la producción científica que publicó PubMed en el periodo seleccionado, sino en indagar también, en sus principales materias y temas como principal novedad investigativa.
De esta forma, mediante los diferentes indicadores (frecuencia y relacionales) disponibles en el Observatorio Métrico de Coronavirus se identificaron las principales líneas temáticas de investigación que se han publicado en los artículos científicos de PubMed en el primer semestre del año 2020.
El análisis realizado describe la capacidad de vinculación e intervención científica que puede provocar los efectos de una enfermedad tan letal como la COVID-19 sobre un amplio espectro de especialidades médicas.
Se ha investigado desde campos específicos como la virología, microbiología, farmacéutica, medicina general integral hasta sus relaciones con la oncología, neurología, pediatría, psicología, siquiatría, oftalmología y nutrición entre las materias con más de 15 artículos asociados en el primer semestre del año 2020. Estos datos no significan que se haya dejado de investigar en otras materias, pero sí indican que las mayores producciones científicas gravitan en las especialidades mencionadas anteriormente.
El análisis de coocurrencia de los MeSH identificó un núcleo de términos conjuntos que se reiteran en los artículos científicos publicados durante el primer semestre del 2020, como se mostró en la sección “Resultados”. Se corroboró este comportamiento con el análisis por palabras clave, con lo que se obtuvieron similares resultados que constatan las principales tendencias investigativas que predominaron en este dominio en el tiempo que se analiza.
Se destaca una amplia red de investigaciones dedicadas a la ansiedad, el estrés, la depresión y la salud mental; así como otras dedicadas a la telemedicina, la epidemiología y políticas de salud entre otras temáticas. Estos análisis visualizan el mayor escenario temático que PubMed socializó mediante su plataforma. Se corrobora que la mayor producción de sus autores y revistas estuvo enfocada en investigaciones sobre coronavirus.
Las ocurrencias más intensas del dominio se dan entre los términos virus y zoonosis. Lo que revela los continuos estudios y el gran número de investigaciones que se siguen realizando sobre el origen del virus, los posibles patógenos y las causas de trasmisión a humanos.
En general, la investigación utiliza diferentes indicadores métricos mediante los cuales logra triangular la información relacionada con las variables que se estudian.
La investigación corrobora las relaciones intrínsecas que existen entre los ejes temáticos de las variables materias, términos MeSH y palabras clave, para definir el contexto temático de un dominio científico, en este caso, PubMed.
Se mostró que PubMed en el primer semestre del 2020 socializó las investigaciones que más se estaban desarrollando en ese primer momento de la enfermedad.
Los resultados muestran que la mayor producción científica sobre coronavirus que visualiza este recurso de información en el primer semestre del año 2020 coincide con los avances médicos de la enfermedad. PubMed se instituye, una vez más, como el principal recurso de información científica de corte médico que deben consultar los investigadores, profesores, médicos, personal de la salud y tomadores de decisiones.
Conocer en qué materias, términos MeSH, palabras claves y especialidades médicas clasifican los artículos publicados en PubMed, así como indagar en sus relaciones, es una información, con un alto valor técnico para un investigador. El presente estudio, a consideración de los autores, transgrede los análisis métricos tradicionales al aportar a la comunidad científica internacional un plus adicional relacionado con el comportamiento temático de las investigaciones sobre la COVID-19 publicadas por PubMed.