INTRODUCCIÓN
Las tecnologías y la información son recursos esenciales que han permitido incrementar los niveles de bienestar humano, así como impulsar el desarrollo económico y social de las naciones de una forma más sustentable y sostenible.
En el caso de la información científica, el ritmo de crecimiento a nivel global es de aproximadamente 500 publicaciones diarias, producción que se ha incrementado aún más durante la pandemia de COVID-19 en todo el mundo (Torres-Salinas, 2020).
Aunque resulta necesario y, por demás, muy favorable el desarrollo sistemático de las tecnologías y la información, cuando esta última crece de forma exponencial y sin una estructuración homogénea provoca alto ruido informacional para los usuarios, y a su vez, silencio documental para los recursos debido a la existencia de grandes volúmenes de información de difícil recuperación.
Rusell y Callegaro (2019) señalan que el ruido documental persiste cuando en una búsqueda de información se obtienen documentos que no se corresponden con la necesidad planteadas. Y el ruido se puede reducir cuando se clasifica la información y se estructura adecuadamente de acuerdo con estándares internacionales (Vargas, Moreno, Oñate & Sanabria, 2020).
Pero esta situación no solo genera caos en los sistemas de almacenamiento, búsqueda y recuperación de información, sino infoxicación1 en las personas ante la avalancha abrumadora de información que limita la capacidad humana de discriminación racional de la información relevante.
Este escenario se torna más complejo en dominios científicos y tecnológicos que necesitan información objetiva, novedosa, confiable y contrastable para documentar decisiones de diferente naturaleza, a través de la consulta y el análisis de información publicada por diferentes sistemas, y en la que se usan disímiles tecnologías en la gestión de los diferentes tipos de documentos generados con distintos soportes, formatos y estructuras de datos. Dicha información, incluso, en muchas ocasiones está al margen de los estándares internacionales.
Uno de los sectores de la ciencia que más complejidad presenta al respecto es la agricultura, por la descomunal cantidad de información que tiene sobre los distintos procesos que intervienen en la producción de alimentos como fuente esencial para la vida humana y animal.
Que exista gran cantidad de información como parte de las investigaciones relacionadas con la agricultura resulta muy bueno; pero malo, que exista dificultad por parte de los investigadores, especialistas y directivos en su adecuada gestión para su óptimo uso. Situación que ocurre en el contexto cubano junto con otro grupo de irregularidades presentes en el sistema de ciencia nacional y que se están actualizando en correspondencia con el modelo de desarrollo económico del país (Rodríguez & Núñez, 2021). Una de las de mayor problema en la gestión de la información se relaciona con el desarrollo de sistemas de información incompatibles dentro del mismo sector, que entorpecen la comunicación entre procesos y con entidades externas (Hidalgo-Delgado, Mariño-Molerio, Amoroso-Fernández & Leiva-Mederos, 2018).
Se ha identificado que en este sector existe desconocimiento acerca de los principales resultados científicos generados en Cuba para el sector, así como desactualización de las corrientes internacionales de investigación en temas de interés nacional (FAO, MINAG & OXFAM, 2021).
Al respecto, el Presidente de la República, como parte del Plan de Soberanía Alimentaria y Educación Nutricional de la nación, emitió orientaciones puntuales sobre la necesidad de construir un observatorio (Díaz-Canel, Núñez & Torres, 2020). Este observatorio, dentro de sus múltiples funciones, ofrece un seguimiento y monitoreo a los ejes críticos de vigilancia del sector (Díaz Pérez, 2020), lo que permitirá impulsar la producción de alimentos con una mayor presencia de la ciencia en los programas identificados como prioritarios para la soberanía alimentaria de la nación (Díaz, Triana, Brizuela, Rodríguez, Giráldez & Blanco, 2021).
A partir de la necesidad expuesta y la solicitud explícita realizada por la máxima dirección del país, la presente investigación tuvo como objetivo desarrollar un sistema interoperable que gestione información científica y tecnológica desde diferentes fuentes científicas nacionales e internacionales para su búsqueda, recuperación, análisis y visualización, de forma que apoye la toma de decisiones desde la documentación de evidencias científicas.
MÉTODOS
Como método de nivel teórico se utilizaron el histórico-lógico y el análisis y la síntesis para trabajar de forma analítica las características de la información científica y tecnológica, los enfoques de los diferentes tipos de sistemas de gestión usados en el contexto científico, junto con el análisis del campo semántico de búsqueda del dominio objeto de estudio. Se aplicó la modelación para el diseño de la arquitectura informacional del sistema, sus flujos de información y de procesos, así como para la elaboración de los diferentes indicadores; asimismo, para el diseño de la ingeniería del software. Además, se empleó el método sistémico estructural para la combinación armónica de los diferentes componentes informacionales con los diversos servicios de valor agregado del sistema.
Como técnicas para la búsqueda y recuperación de información se tuvo en cuenta la teoría Information Search and Retrieval (ISR), que facilita la búsqueda de información en documentos electrónicos en cualquier tipo de colección documental digital. Esta ciencia investiga la búsqueda y recuperación de información, según sus estructuras de metadatos, identificadores persistentes, descriptores temáticos, entre otras características.
En las tecnologías aplicadas para el desarrollo se acudió, en primera instancia, a Symfony. Este es un framework diseñado para desarrollar aplicaciones web, basadas en el patrón Modelo Vista Controlador. Esta tecnología proporciona varias herramientas y clases encaminadas a reducir el tiempo de desarrollo de una aplicación web compleja (Symfony, 2022). También se usaron Angular, una plataforma de aplicaciones web front-end, de fuente abierta basada en TypeScript, que aborda todas las partes del flujo de trabajo mientras se crean aplicaciones web complejas (Angular Team, 2018); y Bootstrap, un framework web front-end gratuito y de código abierto para diseñar sitios y aplicaciones web. A diferencia de muchos frameworks web, se ocupa solo del desarrollo front-end (Otto, Thornton & Bootstrap contributors, 2019).
Como herramientas de desarrollo esta investigación utilizó PostgreSQL como sistema de base de datos relacional de objetos con código abierto, que dispone de un soporte completo, incluye la mayoría de los tipos de datos y es compatible con el almacenamiento de objetos grandes binarios, incluyendo imágenes, sonidos o video (PostgreSQL: About, s. a.).
Se acudió a Apache Web Server como servidor de código abierto para los sistemas operativos modernos, que proporciona un servidor seguro, eficiente y extensible, el cual provee servicios HTTP en sincronización con los estándares HTTP actuales; por último, Visual Studio Code, como editor de código redefinido y optimizado de aplicaciones web y de nube modernas (Microsoft Corporation, s. a.).
Sistema InfoSAEN para el desarrollo de las publicaciones científicas
El sistema InfoSAEN forma parte de la plataforma tecnológica del Observatorio de Soberanía Alimentaria y Educación Nutricional que respalda el Plan de Soberanía Alimentaria y Educación Nutricional (SAEN) de Cuba. Se aprobó por la máxima dirección del país en 2020 para impulsar y fomentar la producción de alimentos con más ciencia desde cada territorio.
El sistema informático InfoSAEN se ocupa de la gestión de diferentes publicaciones científicas relacionadas con temas de interés de cada uno de los programas priorizados para la producción de alimentos.
InfoSAEN, como producto informativo, tiene una interfaz intuitiva y amigable para el usuario. Desde su home se accede directamente a sus tres servicios principales: Búsqueda y Recuperación, Análisis Métricos y Estadísticas por Fuentes de Datos (Fig. 1).
InfoSAEN tiene una metodología que permite la búsqueda de información por diferentes parámetros: programas priorizados del Plan SAEN, procedencia de la fuente de datos, tipología de fuentes de información, junto con la búsqueda temática por etiquetas.
En vistas de mostrar la contextualización de sus diferentes servicios, se escoge como ejemplo el dominio de análisis del programa del arroz; y como fuente de interés, los artículos internacionales relacionados con las variedades de semillas de arroz resistentes (Fig. 2).
Cada resultado tiene vínculo con su ficha descriptiva, donde se ofrece el acceso a la fuente original de publicación; asimismo, permite redireccionar la búsqueda por autores y palabras clave dentro del dominio de análisis.
Se muestran también los principales metadatos del documento y la posibilidad de guardarlo, imprimirlo y compartirlo por correo o mediante las redes sociales. Todas estas opciones aumentan el valor agregado del servicio mediante principios éticos de publicación científica (Fig. 3).
La segunda sección de InfoSAEN, orientada a servicios de análisis de información, tiene un significativo valor de uso para apoyar la toma de decisiones innovadoras desde el concurso de la información científica.
A partir de la sección Analizar se aplican diferentes tipos de indicadores (frecuencia y relacionales), adecuados a cada tipo de documento que gestiona el sistema, junto con otras condiciones de búsqueda como términos a buscar, período de tiempo, procedencia y tipo de gráfico.
En artículos, por ejemplo, el sistema analiza diez indicadores de frecuencia y doce relacionales; las patentes, diez indicadores de frecuencia y trece relacionales; y los documentos de tesis de doctorado, seis indicadores de frecuencia y siete relacionales; y así consecutivamente por cada tipo de documento.
La Figura 4 muestra la productividad de autores en el dominio de artículos cubanos relacionados con el arroz en un período de tiempo. De esta manera, se pueden realizar diferentes análisis relacionados no solo con la productividad autoral, sino con las fuentes, las revistas, sus temáticas, las palabras clave más utilizadas, los países que más publican, así como el comportamiento por años, entre otras indagaciones; también, a partir de los documentos de patentes recuperados en el dominio.
En el caso de los documentos de patentes, el sistema InfoSAEN es capaz de identificar las clasificaciones técnicas del dominio, al representar el número de patentes por temáticas asociadas a la técnica (Fig. 5).
De igual forma, ofrece a continuación de la gráfica la leyenda con el significado de cada clasificación para socializar los sectores del conocimiento que desarrollan tecnologías susceptibles de patentarse (Fig. 6).
En InfoSAEN los indicadores relacionales (Fig. 7) tienen una connotación superior en la toma de decisiones porque permiten conocer diferentes dimensiones de un dominio, así como comprender el comportamiento de las relaciones que se establecen entre diferentes variables de análisis. Todo esto ayuda a documentar decisiones de corte científico, tecnológica, operativa y funcional, comercial y administrativo; así como, mediante evidencias científicas, a orientar mejor las proyecciones y políticas en el sector.
El sistema permite analizar el dominio temático por diferentes variables en estudio, así como por el comportamiento de sus co-ocurrencias, entre otras formas de análisis. La Figura 8 muestra el comportamiento de las palabras clave más usadas en un dominio, según los criterios de recuperación establecidos para su análisis.
Los diferentes análisis que ofrece este sistema permiten describir, desde las características de los documentos y sus contenidos, el comportamiento temático de los programas priorizados o las líneas específicas de trabajo que necesiten investigarse.
CONCLUSIONES
InfoSAEN es un sistema que guía, acompaña y apoya, mediante las evidencias científicas que ofrecen sus servicios, una amplia gama de decisiones que van desde los laboratorios y la producción en el campo hasta la introducción de los productos en la sociedad para su consumo saludable.
InfoSAEN apoya las investigaciones científicas y tecnológicas en el sector de la producción de alimentos, lo que ofrece una plataforma tecnológica que, desde la interoperabilidad entre sistemas de publicaciones científicas, facilita la búsqueda, la recuperación, el procesamiento, el análisis y la visualización de información relevante de los diferentes programas priorizados establecidos en el país para fomentar la producción de alimentos con más ciencia