Introducción
Humanidades Digitales es un escenario disciplinar que ha cobrado mucha fuerza en los últimos diez años. Su desarrollo ha estado afín a los cambios sociales, asociados a la emergencia y proliferación de la vida digital, así como a la preservación de la memoria humana. Con la digitalización de la información, la nueva forma de escritura numérica o binaria hace que todos los modelos de conocimiento se adapten a este nuevo paradigma.
Para emprender proyectos de Humanidades Digitales se necesitan infraestructuras que abarcan desde conocimientos, metodologías y procedimientos, hasta conjuntos de artefactos materiales y recursos humanos.
En Cuba existen varias iniciativas de digitalización en organizaciones de información. Cabe mencionar el proyecto Biblioteca Nacional Digital Cubana, de la Biblioteca Nacional José Martí (BNJM) en conjunto con el Centro Nacional de Información de Ciencias Médicas (INFOMED) quienes gestionan una plataforma de acceso libre para publicar obras importantes de la Historia de Cuba o el proyecto de digitalización “Integración y Cooperación entre Sociedades Científicas” de la Academia de Ciencias de Cuba, la Sociedad Cubana de Ciencias de la Información (SOCICT) y la empresa ISOLTEC Corp., con el objetivo de preservar, archivar y brindar un mayor acceso a libros y documentos de la Academia de Ciencias de Cuba.
Las iniciativas académicas para la incorporación de las Humanidades Digitales están lideradas por el Grupo de Investigación Humanidades Digitales y Ciencias de la Información en Cuba (HDCICuba), que han motivado la realización de investigaciones dedicadas al uso de métodos de procesamiento digital en recursos de información de interés histórico. Este es el caso de la tesis de licenciatura de Rondón (2017) sobre la Revista Infantil Pulgarcito1 y de los proyectos Bachiller Digital2, Finlay Digital3 y Centenario de Benny Moré4, entre otros.
En esta línea se inserta el procesamiento del libro “Apunte Histórico de los Chinos en Cuba”, perteneciente a la colección particular de Yrmina Eng Menéndez, profesora de la Universidad de la Habana y reconocida investigadora de la influencia de la cultura china en Cuba. Este es un libro de la autoría de Antonio Chuffat Latour, publicado en 1927, que casi un siglo después sigue siendo material de referencia para investigadores de varias latitudes.
I. Infraestructuras de las humanidades digitales
El término infraestructura reúne al conjunto de equipos, entidades y estándares necesarios para la actividad humana. Infraestructura de las Humanidades Digitales, se refiere a los medios o recursos que hacen posible la investigación en las ciencias sociales y humanísticas para la creación, uso, aplicación, transmisión, disponibilidad y preservación del conocimiento, la información y las tecnologías.
Las infraestructuras (Bosch, 2015; Rio, 2016) incluyen los contenidos digitales, métodos y metodologías, recursos, herramientas, técnicas, personas, tecnologías y conocimientos que hacen posible la resolución de problemas y la toma de decisiones de las propias ciencias humanísticas y sociales. También se les ha definido como ciberinfraestructuras (Consejo CI NSF, 2006; Priani, 2012) para aludir al entorno que garantiza el acceso a materiales, sistemas y procesos necesarios para la investigación, la enseñanza y la difusión de la cultura.
Bosch (2015, p.102) definió algunas de las características esenciales de las infraestructuras de las Humanidades Digitales:
Deben estar embebidas dentro de otras estructuras sociales, tecnológicas, etc., por lo que resultan transparentes.
Tienen asimismo un ámbito de aplicación espacial o temporal más allá de una práctica aislada.
Deben ser aprendidas de manera inclusiva en una determinada comunidad de práctica, no funcionan de forma aislada.
Se articulan a través de estándares y normas. Esto hace que su cambio sea gradual y requiera negociación y procesos de ajuste. Para funcionar se deben articular sobre bases de infraestructuras ya instaladas.
Se hacen visibles cuando fallan.
La tipología de infraestructuras para las Humanidades Digitales es diversa y puede agruparse en tres enfoques, el técnico, el de investigación y el del conocimiento. Autores como Burrows, (2013); Crane & Terras, (2009); Taylor & Raskin, (2013) hablan del técnico, otros como Amabile, Patterson, Mueller, & et al. (2001); Lynch, (2003); Pritchard, (2008) aluden al enfoque de investigación y finalmente Lyn et al., (2015); Rodríguez-Yunta, 2013; Star & Ruhleder, (1996); Unsworth, (1999) defienden un enfoque al conocimiento. Algunos autores como Edmond (2016) y Rodríguez-Roche (2018) tipifican a las infraestructuras en las tres dimensiones: técnicas, de investigación y del conocimiento.
Infraestructuras técnicas
Las Humanidades Digitales trabajan en el diseño y mantenimiento de colecciones digitales, proyectos de digitalización, etc. Esto no es posible sin recursos, herramientas, metodologías e insumos electrónicos. Todo ello abarca un conjunto de equipos informáticos y software conectado para transportar datos e información, denominados como infraestructuras técnicas.
La informática ofrece la infraestructura necesaria para soportar la circulación de la información de los sistemas artificiales y organizacionales. Comprende muchas más tecnologías que las computadoras, aunque muchas de ellas se basan en dispositivos computacionales o se realizan según sus principios para tratar la información en sus diferentes formas: textos, imágenes, sonidos. (Cañedo et al., 2005, párr.19)
Como parte de los proyectos de Humanidades Digitales, conviven una serie de infraestructuras, a las cuales varios autores hacen alusión como Crane & Terras, (2009); Rojas, (2013); Taylor & Raskin, (2013); Burrows, (2013); Rodríguez-Yunta, (2014); Bosch, (2014); Bravo, (2016); Meza, (2017), entre otros. Estas infraestructuras son las telemáticas, informáticas, tecnológicas o técnicas como suelen llamar.
Atkins (2003) alude al término ciberinfraestructura (infraestructura de información) como mucho más que simples cables y máquinas. Considera las infraestructuras de información centros de computación, bibliotecas digitales, repositorios de datos, instrumentos y herramientas de software.
Por otro lado, Crane & Terras (2009) hacen referencia a la importancia del uso del componente tecnológico, como parte fundamental de las infraestructuras. Son vistas como insumos para hacer ciencia. Afirman que la infraestructura de los años sesenta y setenta fueron fundamentales para apoyar la construcción de capacidades locales de investigación y formación. La postura de esos autores coloca a las infraestructuras técnicas en la frontera con las de investigación y del conocimiento, en tanto reconoce a los componentes tecnológicos materiales como materias primas de la investigación científica.
Según el Informe realizado por la Universidad Interamericana para el desarrollo (2013) titulado Infraestructura tecnológica, alude a que la “infraestructura tecnológica son los elementos o servicios considerados como necesarios y únicos, de los cuales depende el funcionamiento de algo, puede ser una organización, institución o elemento tecnológico” (UNID, 2013, p.11).
Para Leal y Murcia (2014) la infraestructura tecnológica es el conjunto de todos los elementos tecnológicos que integran un proyecto o sustentan una operación. “Esos elementos pueden ser tanto tangibles como intangibles: computadores, routers, servidores, cableado, (hardware), aulas, laboratorios (a lo que denominan infraestructura física) y aplicaciones digitales (software)” (p.253).
Bosch (2014) mira a las ciberinfraestructuras como mediadores del conocimiento. Afirma que estas “tienen una presencia invisible como los cableados, pero que modelan y permiten construir, transportar y acumular conocimiento. Por ejemplo, las redes de computadoras, el software para desarrollo de aplicaciones con alta normalización y protocolos que permiten la reutilización entre plataformas” (p. 104).
Desde la perspectiva de la edición digital, Spence (2014) explica la inserción de las infraestructuras en esos procesos: Plantea que el proceso de creación de una edición digital, una base de datos, una ontología digital o una visualización geoespacial requiere formalizar la interpretación humanística en formato digital. Esta formalización explícita permite acceder al inmenso poder de los dispositivos y de la infraestructura digital, pero supone una negociación intelectual -a menudo delicada, incluso cargada de tensión- entre el lenguaje de la máquina y la expresión humana, que depende de campos científicos bien distintos, cada uno con su propia cultura y, su léxico expresivo de investigación.
Otra definición relacionada es la de Álvarez, et al. (2017) “las infraestructuras tecnológicas con aquellas que permiten el acceso, en términos de conectividad, hardware y software” (párr. 6). En tal sentido alude q que no todas las estructuras constituyen infraestructuras tecnológicas.
Afirma Rondón (2017) que “lo técnico se refiere a las plataformas interoperables, lo organizacional y social, a los servicios bibliotecarios como la selección y gestión de datos, la provisión de servidores, bases de datos, y otros sistemas de cómputo y medios para la preservación digital” (p.8).
Infraestructuras de Investigación
En la literatura consultada, los autores refieren de forma indistinta los términos infraestructuras de investigación e infraestructuras de información para referirse al conjunto de artefactos, procedimientos, herramientas conceptuales y aplicaciones digitales para la investigación.
Para Star & Ruhleder (1996) y Bowker, Baker, Millerand & Ribes, (2010) se denominan infraestructuras de la información; mientras, para European Roadmap for Research Infrastructures of European Strategy Forum for Research Infrastructures (2006), Community Legal Framework for a European Research Infrastructure Consortium-ERIC (2015), Benardou, Champion, Dallas & Hughes (2018), entre otros, se denominan infraestructuras de investigación.
Una concepción pionera de infraestructuras de información, es la brindada por Star & Ruhleder (1996, p.113). Enfatizan la idea de este tipo de infraestructuras con dos dimensiones sustentadas por enfoques: Dimensión espacial (social y técnico) y Dimensión no espacial: (local y global). Llaman a las infraestructuras de investigación, construcciones de un conjunto de actividades técnico, social e institucional.
Bowker, et al. (2010) señala en su definición de infraestructura de información el apoyo que estas brindan a las prácticas de investigación:
Infraestructuras de información a gran escala (o en el lenguaje actual de los proyectos científico a gran escala, ciberinfraestructura y e-Ciencia) tienen como objetivo apoyar las prácticas de investigación a través de una amplia gama de servicios comunitarios digitales y recursos (colaboratorios y centros, datos y repositorios de código, las mejores prácticas y las normas de desarrollo, herramientas de visualización y computación de alto rendimiento, y así sucesivamente). (Bowker, et al., 2010, p.98)
El enfoque dado desde la perspectiva investigativa es similar al anterior. Varios autores han defendido esta tipología a partir de la gestión de los datos abiertos. La incorporación de recursos digitales apoya las nuevas formas de investigar y generar conocimiento.
Nuevas infraestructuras para la gestión de los datos de investigación puede acelerar descubrimientos y cambiar la manera de realizar las investigaciones dentro de un escenario completamente nuevo. La razón de esto es evidente: la revolución digital ha hecho que sea mucho más fácil almacenar, compartir y reutilizar datos. Los datos de investigación de todas las disciplinas están ahora casi universalmente en formato digital. El amplio acceso e intercambio de datos aumenta el retorno de las grandes inversiones que se realizan en la investigación y tiene el potencial para avanzar de manera exponencial el conocimiento. (Couto, 2016, p.47)
El término infraestructuras de investigación ha sido definido de las siguientes maneras:
La Hoja de Ruta Europea para las infraestructuras de investigación publicadas por el Fórum de Estrategia Europea sobre Infraestructuras de Investigación, (en inglés, European Roadmap for Research Infrastructures of European Strategy Forum for Research Infrastructures-ESFRI), las define como “Instalaciones, recursos o servicios de una naturaleza única que han sido identificados por las comunidades de investigación paneuropeas para llevar a cabo actividades de alto nivel en todos los campos” (ESFRI, 2006, p.16).
En ESFRI consideran a las infraestructuras de investigación, como los recursos que contienen el conocimiento, tales como colecciones, archivos y bases de datos. Infraestructuras de investigación pueden ser “asentadas sola”, “distribuida”, o “virtual” (el servicio que suministra electrónicamente). A menudo requieren sistemas de información estructurados relacionados con la gestión de datos, lo que permite la información y la comunicación.
El Marco Jurídico Comunitario para un consorcio europeo de infraestructuras de investigación (en inglés, Community Legal Framework for a European Research Infrastructure Consortium-ERIC), organización que se encarga del establecimiento de infraestructuras de investigación de interés europeo, acota la siguiente definición:
Infraestructuras de investigación se refiere a las instalaciones, los recursos y los servicios relacionados que son utilizados por la comunidad científica para llevar a cabo investigaciones de alto nivel en sus respectivos campos y cubre el equipo científico importante o instrumental; recursos basados en el conocimiento, tales como colecciones, archivos o estructuras de información científica; permitiendo infraestructuras basadas en Tecnología de la Información y Comunicaciones, tales como GRID , software y comunicaciones, o cualquier otra entidad de carácter único necesaria para lograr la excelencia en la investigación. (ERIC, 2015, p.6)
Las infraestructuras de investigación contemporáneas tienen la aspiración de ser no simplemente colecciones de recursos de investigación, o herramientas para llevar a cabo la investigación: son energizados por una comunidad de instituciones de investigación e investigadores individuales. Benardou et al. (2018) conciben a las infraestructuras de investigación dentro de las comunidades académicas.
Una infraestructura digital de investigación ideal hoy debe ser concebido principalmente como un ecosistema académico: uno que apoya el desarrollo del curso académico y el uso de los recursos de investigación, herramientas y métodos, y las salidas que permiten, a través de la aplicación de las tecnologías digitales. (2018, p.3)
Este enfoque facilita el análisis, acceso y manejo de un gran volumen de información a través de la visualización de datos para las humanidades y otros campos en general. Las herramientas de visualización permiten mostrar de forma gráfica, el resultado de las investigaciones
Entre las infraestructuras de investigación más representativas en la literatura consultada se encuentran: Collaborative European Digital Archival Research Infrastructure (CENDARI) , Common Language Resources and Technologies (CLARIN) , Digital Research Infrastructure for the Arts and the Humanities (DARIAH) , Digital Research Tools Directory (DiRT) , Advanced Research Infrastructure for Archaeological Dataset Networking in Europe (ARIADNE) , European Holocaust Research Infrastructure (EHRI) , European Research Infrastructure Consortium (ERIC) , Medieval Scholary Electronic Alliance (MESA) , Nineteenth Century Scholarship Online (NINES) , Oxford e-research Center (OERC) , Pooling Activities, Resourches and Tools for Heritage E-research Networking, Optimization and Synergies (PARTHENOS) , Research infrastructure on Religious Studies (ReIRes) , The Hathi Trust Research Center (HTRC).
Las infraestructuras de investigación constituyen un eje clave para el desarrollo y aplicación de conocimientos y tecnologías. De igual manera juegan un papel primordial en la generación de conocimientos de frontera, incluidos los orientados a los retos de la sociedad, la experimentación, el tratamiento masivo de datos de investigación. Además, tienen un importante componente tecnológico y de innovación asociada a su propio desarrollo, así como en la prestación de servicios científico-técnicos.
Infraestructuras del conocimiento
La mayoría de los autores consultados Star & Ruhleder, (1996); Unsworth, (1999), Rodríguez-Yunta, (2013); Lyn et al., (2015); Edmond, (2016); entre otros, señalan la idea de relacionar este enfoque, con las organizaciones tradicionales de información y conocimiento relacionadas con las Galerías, Bibliotecas, Archivos y Museos (Galleries, Libraries, Archives and Museums: GLAMs). Precisamente porque facilitan el uso y difusión de las ontologías, clasificaciones, los tesauros, etc., resultado propio de esta área (Edmond, 2016).
Los GLAMs son espacios para la memoria, el encuentro y el esparcimiento de los ciudadanos. Su misión fundamental es preservar y hacer accesible las fuentes primarias a los investigadores. Estas siglas se suelen poner en relación con acciones y actuaciones de difusión de los acervos culturales e históricos, de los que estas instituciones son depositarias, en el mundo digital.
Smith (1997 y 2002) considera que las infraestructuras de conocimiento están compuestas por el conjunto de organizaciones e instituciones públicas y privadas cuyo papel consiste en la producción, mantenimiento, distribución, gestión y protección del conocimiento, y que poseen unas determinadas características (economías de escala, indivisibilidad, multiplicidad de usuarios y externalidades).
Con esa mirada, la infraestructura de conocimiento estaría conformada por la base de conocimiento industrial que es pública (no en el sentido de que es producida por el sector público, sino en el de que es conocimiento accesible a todas las empresas) y que es desarrollada, mantenida y difundida por organizaciones de varios tipos.
Según Hamdouch y Moulaert (2006) la infraestructura de conocimiento se puede definir como “el complejo institucional que comprende la amplia gama de organizaciones, instituciones y redes (y sus específicos constituyentes) que contribuyen a la constitución y evolución de la base de conocimiento en una determinada área espacial, así como los recursos y competencias que alimentan sus capacidades innovadoras y dinámicas” (p. 27).
Para Svensson (2010) las bibliotecas son una parte importante de la infraestructura tradicional de las humanidades y, en cierto sentido, pueden considerarse como laboratorios para estas disciplinas, localizados fuera de los departamentos universitarios. Desde este punto de vista, la biblioteca en el espacio académico tiene un rol de investigación y de preservación y acceso al conocimiento, por lo que puede considerarse una infraestructura de investigación y del conocimiento.
Cunningham (2010,) subraya el carácter colaborativo y la oportunidad para las bibliotecas en las Humanidades Digitales, que pueden aportar su experiencia en tres aspectos centrales: la sustitución de fuentes impresas por recursos electrónicos; el problema de la preservación de contenidos digitales; y la difusión y gestión de accesos a recursos electrónicos.
Estos sistemas de información se enfrentan actualmente a nuevas e interesantes oportunidades de cooperación desde sus experiencias. Galina Rusell (2011) hace referencia a que las bibliotecas, fundamentalmente, “apoyan la proporción de espacios/prácticas/lineamientos que sirvan a los creadores de recursos digitales para las Humanidades, así como facilitar el registro, digitalización, manejo, uso y preservación de estos recursos” (p.4).
Rodríguez-Yunta (2013), insiste en el papel de las bibliotecas debido a que podrían dar un servicio de apoyo fundamental en el diseño, gestión y preservación de productos informativos para las humanidades digitales. Abarca los numerosos aportes de estas instituciones en la creación de bibliotecas digitales, proyectos de digitalización de fondos y colecciones, tanto fuentes primarias como trabajos académicos en humanidades.
Las instituciones tradicionales, percibidas como infraestructuras de conocimiento ocupan un papel importante en el diseño, gestión, acceso y preservación de recursos informacionales físicos y electrónicos. Obtienen un papel significativo en la producción tanto de servicios como de proyectos investigativos. Contribuyen al apoyo institucional y colaboración con instituciones y/o miembros académicos.
Existe un grupo de infraestructuras del conocimiento identificadas durante la realización de este trabajo: Archivo Virtual de Indias, Biblioteca Digital de Cervantes, Biblioteca Virtual del Louvre, International Federation of Library Associations and Institutions (IFLA) y Online Computer Library Center (OCLC) . Las Infraestructuras de información constituyen una gran herramienta para la distribución del conocimiento, la cultura y la práctica, entre disciplinas, usuarios, universidades, etc. Estas se refieren a las infraestructuras tradicionales del conocimiento (GLAMs), instituciones de alta herencia cultural.
Perspectiva integradora de las infraestructuras
La tipología de infraestructuras propuesta por Edmond (2016) involucra a la investigación, el conocimiento y la ciberinfraestructura. Defiende la idea de largas tradiciones que preceden al giro de las humanidades hacia lo digital que son la importancia de las comunidades académicas, la relación que los académicos tienen con sus fuentes y herramientas, y las instituciones en las que se mantienen estas fuentes y herramientas.
El mismo texto refiere que las infraestructuras digitales, virtuales o cibernéticas, son consideradas, desde su punto de vista, artefactos tecnológicos. Las infraestructuras de investigación tienden tributar al uso de métodos humanísticos y tecnológicos para apoyar la investigación y a los investigadores. De igual manera, (Edmond, 2016) reivindica a las infraestructuras de conocimiento originales: bibliotecas, archivos y colecciones temáticas, vistas como elementos de acceso a la fuente.
Rodríguez-Roche (2018) segmenta a las infraestructuras de humanidades digitales en tres grandes grupos, luego de una revisión de la bibliografía sobre el tema: Infraestructuras técnicas (redes y computadoras), infraestructuras de investigación (recursos para la investigación) e infraestructuras del conocimiento (Bibliotecas, Archivos, y Museos).
El enfoque técnico refiere a las infraestructuras como cualquier recurso tecnológico que apoye y/o facilite un proyecto de humanidades digitales su área de interés básicamente se centra en el acceso a redes de banda ancha y software de interpretación de textos y colecciones de texto. El enfoque de investigación se refiere a las infraestructuras como los recursos que contribuyen de forma significativa a la gestión del conocimiento y que tienen un impacto visible y activo en los resultados de investigación. El enfoque del conocimiento reivindica a las “infraestructuras del conocimiento originales”, GLAMS (bibliotecas, archivos y museos) como concentradores de escenarios de compartición de conocimientos entre disciplinas y con los usuarios/ ciudadanos/ consumidores, para la preservación de la cultura.
Organizaciones de Infraestructuras
Existen grandes iniciativas provenientes de países y asociaciones, encaminadas a respaldar el trabajo técnico, investigativo y cognoscitivo para las Humanidades Digitales. Estas constituyen un servicio que facilita el trabajo de los expertos e intenta cumplir con altos indicadores, las necesidades y expectativas de los usuarios.
Rodríguez (2018), identifica las más reconocidas: Collaborative European Digital Archival Research Infrastructure (CENDARI), Common Language Resources and Technology Infrastructure (CLARIN), Digital Research Infrastructure for the Arts and the Humanities (DARIAH), Digital Research Tools Directory (DiRT), Advanced Research Infrastructure for Archaeological Dataset Networking in Europe (ARIADNE), European Holocaust Research Infrastructure (EHRI), European Research Infrastructure Consortium (ERIC), International Federation of Library Associations and Institutions (IFLA), Medieval Scholary Electronic Alliance (MESA), Nineteenth Century Scholarship Online (NINES) y el Online Computer Library Center (OCLC).
Contexto de las infraestructuras para las Humanidades Digitales en Cuba
La informatización de la sociedad cubana, el cumplimiento de las metas y objetivos de la agenda 2030, la existencia de un cuerpo regulatorio para los sistemas de información y de las propias organizaciones de información, son el contexto en que se crean o eligen las infraestructuras para la ejecución de proyectos digitales en cualquier área dentro del país, incluidas las humanidades.
La informatización de la sociedad cubana es un proceso de utilización ordenada y conjunta de las Tecnologías de la Información y las Comunicaciones (TICs) con el objetivo de satisfacer las necesidades de todas las esferas de la sociedad. Entre sus políticas específicas y acápites existe un espacio para la creación, implementación, desarrollo y modernización de la infraestructura tecnológica.
La política integral para el perfeccionamiento de la informatización de la sociedad cubana, redactada por Ministerio de Comunicaciones (2017) incluye en su política específica número 7, el objetivo de desarrollar y modernizar la infraestructura tecnológica prestando especial atención al despliegue de la banda ancha y a la producción de dispositivos informáticos en Cuba. Ello con el objetivo de priorizar la industria y los sectores productivos de impacto en la sociedad. De igual manera incentiva a potenciar el desarrollo de la infraestructura de telecomunicaciones para garantizar su cobertura nacional y así la capilaridad en la red de acceso con el empleo de tecnologías inalámbricas y móviles.
La agenda 2030 tiene entre sus objetivos está: Construir infraestructuras resilientes, promover la industrialización inclusiva y sostenible y fomentar la innovación. Su enfoque está dirigido a impulsar acciones relacionadas con el acceso pleno a la información y aumentar la investigación científica y mejorar la capacidad tecnológica de los sectores industriales de todos los países. También apoya el desarrollo de tecnologías, la investigación y la innovación nacionales en los países en desarrollo y el acceso a la tecnología de la información y las comunicaciones.
La Agenda 2030 para el Desarrollo Sostenible, aprobada en septiembre de 2015 por la Asamblea General de las Naciones Unidas, establece una visión transformadora hacia la sostenibilidad económica, social y ambiental de los 193 Estados Miembros que la suscribieron y será la guía de referencia para el trabajo de la institución en pos de esta visión durante los próximos 15 años. El conocimiento de los 17 Objetivos de Desarrollo Sostenible (ODS) asociados a esta Agenda ayuda a evaluar el punto de partida de los países de la región y a analizar y formular los medios para alcanzar esta nueva visión del desarrollo sostenible. En la descripción de sus objetivos y metas, deja plasmado la necesidad e importancia que presupone para el desarrollo sostenible, el acceso a la información en cualquier sector de la sociedad, la participación ciudadana y el uso de las tecnologías de la información y las comunicaciones.
Existe un cuerpo regulatorio para los sistemas de información y de las propias organizaciones. De referencia se encuentran las leyes de archivos (Decreto- Ley No. 265 Del Sistema Nacional de Archivos de la República de Cuba, Resolución No. 41 /2009 Lineamientos para la conservación de las fuentes documentales, Decreto-Ley No. 221 De los Archivos de la República de Cuba, Resolución No. 60/11 Normas de control interno, Reglamento de la Ley No. 107/09 de la Contraloría General de la República de Cuba, etc.), de bibliotecas (Decreto-Ley No. 271 de las Bibliotecas de la República de Cuba), de museos (Ley No. 106 del Sistema Nacional de Museos de la República de Cuba), de sistemas de información empresariales (Decreto-Ley No. 334: Modificativo del Decreto 252/2017 Sobre la continuidad y el fortalecimiento del Sistema de Dirección y Gestión Empresarial Estatal, Decreto No.33: Modificativo del Decreto 281/2007 Reglamento para la Implementación y Consolidación del Sistema de Dirección y Gestión Empresarial Estatal, Decreto No.335 Del Sistema Empresarial Estatal Cubano, Decreto No.336 Del sistema de relaciones de las organizaciones superiores de dirección empresarial, etc.). Esas leyes no son infraestructuras digitales, pero regulan la forma en que esas serán utilizadas en el país, por esas organizaciones
Actualmente organizaciones cubanas en todas las esferas están introduciendo recursos y servicios tecnológicos, dado por la ampliación de servicios de la Empresa de Telecomunicaciones de Cuba (ETECSA), en esa esfera. Algunos de los servicios más fortalecidos han sido los de acceso internet y almacenamiento de datos (Según datos ofrecidos en el sitio oficial de ETECSA www.etecsa.cu).
La esfera investigativa se ve afianzada en los Centros de Información, Bibliotecas, Museos, Galerías, etc. que a menudo crean plataformas de intercambio con su perfil para permitir el acceso y uso de sus recursos y así dinamizar el proceso investigativo con sus usuarios. Ejemplo de ellos son: La red de Centros de Información del Polo Científico de La Habana, La Red de Bibliotecas Médicas , La Red Cubana de Ciencia , etc.
Una de las infraestructuras de mayor desarrollo en el país, es la red cubana de salud, Infomed. Esta surge como una necesidad de desarrollar las redes académicas usando las tecnologías de la información que ha mejorado exponencialmente el acceso a la información y al conocimiento de los trabajadores de la salud en Cuba. El proyecto de Infomed ha dotado de infraestructura técnica a toda la red nacional y creada una plataforma para la enseñanza y la investigación.
La Biblioteca Nacional de Cuba José Martí (BNJM) contempla un proyecto llamado Biblioteca Digital de Cuba, implementado en su sitio oficial, y que resguarda bajo un mirador IIIF, documentos significativos de la Historia de Cuba. En el año 2000 comienza a digitalizarse la colección de la BNJM. Según MsC. Pedro Urra (2013), profesor titular de la Universidad de La Habana, fundador y asesor de este proyecto, en el año 2013 comienza a definirse los objetivos estratégicos del proyecto que incluiría la infraestructura IIIF al proyecto de digitalización de la biblioteca.
Según Urra (2013) en el VII Encuentro Internacional de Investigadores y Estudiosos de la Comunicación y la Información (ICOM 2013), La Biblioteca Nacional Digital Cubana (BNDC), integra el conjunto de colecciones de documentos que representan la producción literaria, científica y cultural de la nación, disponible en forma de fuentes, servicios y sistemas de información digital en red que se sustentan por el trabajo cooperado de instituciones, organizaciones y personas que producen, recopilan, organizan, diseminan y preservan esos documentos para servir a las presentes y futuras generaciones, custodiadas como bien público por la Biblioteca Nacional “José Martí”
Desde el impulso de ese proyecto, y la experiencia de utilización para el Procesamiento de la Revista Pulgarcito, la presente investigación se apoya en el Marco Internacional de Interoperabilidad de Imágenes (IIIF). Sobre este tema aborda el siguiente epígrafe.
Marco Internacional de Interoperabilidad de Imágenes (IIIF)
El Marco Internacional de Interoperabilidad de Imágenes, en inglés, International Image Interoperability Framework (IIIF) es un proyecto desarrollado desde 2011 por la Biblioteca Bodleian, la Biblioteca Británica y la Biblioteca de la Universidad de Stanford para mejorar la usabilidad de las imágenes digitales almacenadas en archivos disponibles a través de la Web.
Según el sitio web oficial www.iiif.io, IIIF contiene un conjunto de especificaciones técnicas construido alrededor de retos comunes del acceso al patrimonio cultural. Es una comunidad de software, herramientas, contenido, gente, e instituciones que resuelven retos de interoperabilidad de imágenes basados en estándares.
De igual manera el sitio oficial plasma los objetivos. Entre ellos se encuentra la capacidad de brindar a los académicos un nivel sin precedentes de acceso uniforme y rico a los recursos basados en imágenes alojados en todo el mundo. Además, permite definir un conjunto de interfaces de programación de aplicaciones comunes que admitan la interoperabilidad entre repositorios de imágenes. Por último, brinda acceso para desarrollar, cultivar y documentar tecnologías compartidas, como servidores de imágenes y clientes web, que brinden una experiencia de usuario de clase mundial para ver, comparar, manipular y anotar imágenes.
Métodos
La investigación fue un estudio descriptivo de caso único, con vocación documental. Del texto seleccionado se investigaron sus orígenes, se analizó su contenido y se propuso una representación digital de él. Como parte de la investigación se identificó contenidos bibliográficos de interés para la investigación sobre la presencia de los chinos en Cuba.
Se empleó un diseño cualitativo, lo que aportó flexibilidad en la investigación. Para la recopilación, procesamiento de los datos y el análisis de la información se emplearon varios métodos y herramientas.
En el orden teórico y referencial, el método de análisis de contenido permitió identificar las principales referencias para la comprensión y argumentación teórica sobre infraestructuras de Humanidades Digitales. Con el método histórico se comprendió el escenario de producción del libro. La entrevista en profundidad realizada a la poseedora del libro, sirvió para indagar en historias asociadas a la presencia china en Cuba y complementar el contexto de producción.
En el orden infraestructural, el método de los datos enlazados y de la herramienta IIIF permitió crear y publicar los metadatos en la plataforma Mirador, que es un visor de imágenes de código abierto, que proporciona imágenes de alta resolución en un espacio de trabajo, permitió la comparación de múltiples imágenes desde diversos repositorios. ABBYY FineReader 14 OCR Editor, programa editor de texto se utilizó para capturar las imágenes digitales y revisar el contenido del texto digitalizado.
Las siguientes herramientas fueron asesoradas por Víctor Ricardo Díaz, Jefe de Desarrollo de Software del Centro Nacional de Información de Ciencias Médicas:
IrganView como herramienta optimizar de forma homogénea el tamaño y resolución de la imagen para subir al servidor.
FileZilla como herramienta para subir las imágenes y el documento Formato de Documento portátil (PDF) para el servidor.
iiif-manifest-editor para describir y entregar imágenes a través de la web, así como también metadatos basados en presentaciones sobre secuencias estructuradas de imágenes.
Scripts como herramienta para representar el modelo y estructurar los datos que representan la revista.
Para la formalización de la investigación se utilizó el estilo bibliográfico APA propuesto por la American Psychological Association en su 6ta edición editada en el año 2009.
Se empleó el gestor bibliográfico EndNote, versión X, para recopilar las referencias bibliográficas utilizadas. Se crearon dos bibliotecas: una que contiene toda la bibliografía utilizada en la tesis, y otra que recoge la investigación bibliográfica sobre la presencia china en Cuba, para la investigación sobre ese tema.
Desarrollo
La investigación logró poner accesible a través de internet el libro “Apunte Histórico de los Chinos en Cuba”, dispuesto en una plataforma interoperable. El texto fue digitalizado y procesado para su publicación en el catálogo IIIF que se encuentra en el Centro Nacional de Información de Ciencias Médicas (INFOMED).
A continuación se describen los procesos que dieron acceso digital al contenido del libro objeto de investigación “Apunte Histórico de los Chinos en Cuba”.
Digitalización
El libro se digitalizó en el departamento de Lengua Turca de la Facultad de Artes y Letras de la Universidad de la Habana. Se utilizó un escáner Hp de tipo plano. El driver Twain fue el software utilizado por defecto para escanear las imágenes y realizar cambios en las mismas.
El driver Twain es un protocolo creado por fabricantes de software y hardware para que cualquier aplicación pueda adquirir imágenes desde dentro del propio programa, de manera que desde cualquier aplicación instalada en el equipo se puedan digitalizar imágenes, modificarlas y salvarla en el formato deseado.
En la digitalización se tuvo extrema precaución debido al grado de deterioro del ejemplar. Se procesaron con el formato PDF y la resolución de 300 dpi aproximadamente.
Procesamiento de las imágenes
Las imágenes del libro fueron procesadas con herramientas como IrganView, Filezilla y Scripts que conllevaron a la estructuración de un Manifiesto. Los pasos para el procesamiento de imágenes fueron los siguientes:
Copiar las imágenes para la carpeta donde se realizó el procesamiento preliminar antes de subirla para el servidor (PII). El resultado fue la estructuración secuencial de las imágenes. (Fig. 1)
Realizar el proceso de transformación de las imágenes con el IrganView para optimizarlas al tamaño y la resolución adecuada. El resultado fue la normalización del tamaño y resolución de las imágenes. (Fig. 2)
Subir las imágenes para el servidor por Protocolo de Transferencia de Archivos (FTP) usando el Filezilla. El resultado fue las imágenes en el servidor por medio del FTP. (Fig. 3)
Realizar el procesamiento en el servidor para convertirlas al formato del Servidor de Imágenes y crear el manifiesto utilizando un Script. (Fig. 4) El resultado fue redefinir los siguientes datos en la interfaz:
Nombre del usuario que realiza la operación: Víctor (programador)
Nombre de la Institución a la que pertenece la colección: Colección personal de MsC. Eng
Nombre de la Colección: Apunte Histórico de los Chinos en Cuba
Nombre del Proyecto: Apunte Histórico de los Chinos en Cuba
Tipo de Colección: Libro raro y valioso
Procesar con otro Script los datos y las imágenes para la obtención automática de los campos de descripción del Manifiesto. (Fig. 5)
Como resultado se obtuvo el manifiesto de forma automática, con el siguiente URI (Fig. 6):
http://imagenes.sld.cu/iiif/prezi/bdc/bpal/librosrarosyvaliosos/chinosencuba/manifest.json
Publicación de los metadatos
Los metadatos se editaron con iiif-manifest-editor. Los campos por defecto son: URI del manifiesto, la descripción, etiqueta principal, atribución, el logo y enlaces. Para ello se asignaron etiquetas HTTP para definir la negrita, cursiva y espacios entre metadatos.
Los metadatos del libro fueron normalizados según las Reglas Angloamericanas de Catalogación. Los pasos llevados a cabo fueron:
Crear la carpeta de descarga en el servidor para el libro.
Cargar el logo al servidor por el FTP con el uso de la herramienta FileZilla, se copió su URL http://imagenes.sld.cu/download/chinosencuba/logos/logos.jpg en el editor del Manifiesto para su publicación. (Fig. 9)
Cargar el libro en PDF al servidor por el FTP con el uso de FileZilla, se copió el URl y en el editor del Manifiesto. Se estableció el mismo procedimiento para el resto de los PDF descargables, el listado referencial sobre obras de la temática (chinos en Cuba) y el resumen por partes del libro.
Los URI son:
Normalizar la portada, contraportada y la numeración de las imágenes, así como se incluyó la opción para crear anotaciones sobre las imágenes.
Validar el Manifiesto, se guardó en el servidor de API de Imagen por el FTP utilizando FileZilla como herramienta para su enlace y acceso abierto de sus datos y metadatos.
Estructuración de los datos en el visualizador
El Visor Mirador es el software implementado para las colecciones cubanas de valor patrimonial en la Biblioteca Nacional “José Martí”. Permite visualizar el procedimiento de automatización de las imágenes en el servidor y la publicación de los metadatos. Se realizaron los siguientes pasos:
Definir y estructurar la información que representa la página principal del Mirador con el uso de un Script. (Fig. 10)
Cargar y salvar en el servidor por el FTP con el uso de FileZilla. De este modo quedó publicado el libro en la página principal del Mirador que muestra colecciones cubanas, con el URL: iiif.sld.cu (Fig. 11)
De igual manera el libro se integró a las colecciones de acceso global en el Mirador, para ello:
Se creó, a través de un Script, la colección del libro para el Mirador, que compila colecciones a nivel internacional con el URI del Manifiesto de los ejemplares y la ubicación del proyecto. (Fig. 12)
Se subió y guardó en el servidor por el FTP con el uso de FileZilla.
Se integró con el URl del Manifiesto para el acceso desde un contexto más global que permite hacer comparaciones con otras colecciones disponibles de forma abierta.
Interfaz de consulta
El procesamiento digital realizado en la presente investigación, garantiza el acceso al contenido completo del libro, a un listado referencial sobre la temática así como a un resumen de las partes del libro, en PDF, disponible en internet, de forma abierta y gratuita para todas las personas. (Fig. 13)
El URI para su acceso es: iiif.sld.cu/colección/04/04/2019apunte-historico-de-los-chinos-en-cuba
Esta versión procesada ofrece ventajas en la interacción con el usuario, entre las que se encuentran:
Posee la opción de visualizar en la pantalla completa las imágenes del libro. (Fig. 14)
Muestra los metadatos que describen el libro en una pestaña con la información estructurada y organizada. (Fig.15)
Reconoce los caracteres textuales y permite realizar anotaciones sobre las imágenes. (Fig. 19)
Permite girar las imágenes, así como realizar ampliaciones profundas sin perder su calidad. (Fig. 20)
Admite comparaciones entre las imágenes de la revista y estas con otras colecciones disponibles en el Mirador desde una misma interfaz. (Fig.21)
Revisión del texto y conversión en UTF-8
Como fase final de producción, se editó el texto capturado vía escáner, utilizando el ABBYY FineReader, con el objetivo de obtener una versión editable y manipulable del texto que permita realizar análisis posteriores con herramientas de procesamiento de lenguaje natural. Por eso se convirtió el resultado final al formato UTF-8 (8-bit Unicode Transformation Format), uno de los sistemas de codificación de caracteres más extendido y con más soporte en el mundo.
El proceso de trabajo fue el siguiente:
Se instaló el software ABBYY FineReader 14 OCR Editor.
Se procedió al reconocimiento óptico de caracteres, en inglés, Optical Character Recognition (OCR).
Corrección del texto completo. Se corrigió en el propio ABBYY FineReader, la caligrafía y ortografía de cada una de las palabras del libro. Se realizó la comparación con el texto original. Entre los aspectos más significativos se distinguió la ausencia de tildes, sustitución de unas vocales por otras y el mal empleo de las mayúsculas y minúsculas. (Fig. 22)
Consideraciones finales
Las infraestructuras de las humanidades digitales son necesarias en la era actual. Constituyen un conjunto de servicios, plataformas, recursos de trabajo, estándares, protocolos y/o procedimientos para optimizar recursos humanos, compartir saberes y fomentar la colaboración.
El Marco Internacional de Interoperabilidad de Imagen posee tecnologías y estándares propios de las Humanidades Digitales. Permite crear proyectos de visualización en línea.
Conservar la memoria histórica de Cuba, garantiza su permanencia en el tiempo. El libro “Apunte Histórico de los Chinos en Cuba”, constituye la primera obra literaria al respecto.
Con Marco Internacional de Interoperabilidad de Imagen (IIIF) se procesó un libro de casi un siglo de publicado. El trabajo con la infraestructura permitió el acceso y uso del texto, el cual se encuentra disponible en internet.
La versión procesada del libro ofrece el acceso abierto al libro, al resumen por capítulos y a un listado referencial sobre la presencia china en Cuba, que antes no se encontraba disponible en internet.
La conversión del texto en UTF-8 constituye los inicios para un análisis posterior con herramientas avanzadas de procesamiento del lenguaje natural.