SciELO - Scientific Electronic Library Online

 
vol.14 issue5The description as a part of the treatment of the personal archives in the XXI century: searching new alternativesRethinking about the figure of the information user author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


ACIMED

Print version ISSN 1024-9435

ACIMED vol.14 no.5 Ciudad de La Habana Sept.-Oct. 2006

 

Herramientas para la creación de colecciones digitales

MSc. Yanetsys Sarduy Domínguez 1 y Lic. Pedro Urra González2

Resumen

Con el objetivo de facilitar la selección de una herramienta para la creación de colecciones digitales en una institución promedio de salud en Cuba, se caracterizan una serie de software desarrollados con este fin, a saber: Greenstone, DSpace, Fedora y CONTENTdm. Greenstone parece ser la opción de elección para crear colecciones digitales en una institución promedio de salud en Cuba.

Palabras clave: Publicaciones digitales, software.

Abstract

With the objective to facilitate the selection of a tool for the creation of digital collections in an average health institution in Cuba, a series of software developed with this end is characterized, such as: Greenstone, DSpace, Fedora and CONTENTdm. Greenstone seems to be the choice of excellence to create digital collections in a health average institution in Cuba.

Key words: Digital publications, software.

Copyright: © ECIMED. Contribución de acceso abierto, distribuida bajo los términos de la Licencia Creative Commons Reconocimiento-No Comercial-Compartir Igual 2.0, que permite consultar, reproducir, distribuir, comunicar públicamente y utilizar los resultados del trabajo en la práctica, así como todos sus derivados, sin propósitos comerciales y con licencia idéntica, siempre que se cite adecuadamente el autor o los autores y su fuente original.

Cita (Vancouver): Sarduy Domínguez Y, Urra González P. Herramientas para la creación de colecciones digitales. Acimed 2006;14(5). Disponible en: http://bvs.sld.cu/revistas/aci/vol14_5_06/aci19506.htm [Consultado: día/mes/año].

Actualmente, la creación de colecciones digitales goza de un gran auge a escala mundial. Este proceso se basa en el desarrollo de herramientas que sustentan su implementación.

El objetivo principal de las colecciones digitales de documentos es socializar los conocimientos y resultados obtenidos en el proceso de investigación, así como evitar la duplicidad de esfuerzos en este sentido.

La amplia proliferación de las herramientas para crear colecciones digitales hace que su selección requiera de un proceso de análisis antes de escoger la que se utilizará en cada institución, según sus necesidades y las bondades que ofrezca dicha herramienta. La selección debe centrarse principalmente en los siguientes aspectos:

  • Interfaz: La forma de presentación al usuario final, así como la presentación a la persona que se ocupa del procesamiento.
  • Flexibilidad: Adaptación de la herramienta, según las características institucionales.
  • Lenguaje: Idiomas del ambiente de procesamiento y de la interfaz de recuperación.
  • Contenidos: Formato de los documentos que acepta en sus colecciones.
  • Procesamiento: Facilidades para procesar los documentos para una recuperación efectiva.
  • Recuperación: Formas que tiene el usuario de acceder a los documentos.
  • Requerimientos de sistema: Características de las computadoras que soportarán la herramienta y de las que harán uso de las colecciones.
  • Servidor Web: Requerimientos de los servidores en los que se soportará la herramienta.
  • Licencia: Si es libre o privada.
  • Costo: Gratis o pago.

Entre las herramientas más populares disponibles actualmente para la creación de colecciones digitales se encuentran: Greenstone, Dspace, Fedora y CONTENTdm.

Caracterización de las herramientas
Greenstone1,2

Greenstone es un conjunto de programas y aplicaciones de software, diseñados para la creación y difusión de colecciones digitales, elaborado por la Universidad de Waikato de Nueva Zelanda y que se estableció en el año 2000 como parte de su proyecto de la biblioteca digital. Esta herramienta es open source y se desarrolló bajo la licencia pública GPL; su distribución es gratuita y en el paquete de instalación se ofrece el código fuente. Esto permite que se pueda adaptar a las necesidades de las instituciones que decidan utilizarlo como repositorio para sus colecciones digitales.

Greenstone se soporta en Windows y Unix. Además, puede desarrollarse perfectamente sobre servidores Web Apache, PWS o IIS de Microsoft y requiere la aplicación Java para su correcto funcionamiento. Las computadoras clientes podrán mostrar las colecciones en ambiente Web mediante sus navegadores, Internet Explorer u otros. En el proceso de instalación, se ofrece la posibilidad de instalar la herramienta en varios idiomas, entre los que se encuentra el español. Esta alternativa permite que la interfaz, tanto para el trabajo bibliotecario como de presentación de los usuarios, pueda consultarse en el idioma nativo.

Greenstone tiene dos posibilidades para instalarse: biblioteca local y biblioteca Web. La biblioteca local es para computadoras autónomas. Tiene incluido un servidor Web, limitado, para poder utilizarlo por otras computadoras de la red. No necesita ningún tipo de configuración por parte de sus usuarios. La biblioteca Web puede instalarse en cualquier computadora con un servidor Web para distribuir las colecciones con mayor amplitud.

El procesamiento de documentos con Greenstone, que acepta todo tipo de formatos, como son : texto, imágenes, bases de datos en Isis, etc., se realiza de forma fácil y ágil por medio de la interfaz del bibliotecario. En este ambiente de trabajo se asignan metadatos a los documentos mediante una plantilla, según el modelo de metadatos escogido, entre los que está Dublin Core y un formato propio que ofrece Greenstone. Es posible asignar metadatos a los documentos individuales o a varios, agrupados en carpetas.

La página principal de cada colección creada con Greenstone, tiene una breve descripción del tema de la colección y las formas en las que pueden realizarse las búsquedas.

La recuperación puede hacerse por medio de los índices que declare el creador de la colección; incluye autor, título, materia y el texto completo. Además, puede navegarse en la colección por medio de la consulta de listas, también declaradas por el creador de la colección, principalmente autor, temática y fecha.

DSpace3,4

DSpace es un sistema que provee una forma de gestionar materiales y publicaciones resultantes, tanto de la actividad de investigación como de educación, almacenadas en un repositorio que ofrece a los usuarios accesibilidad en todo momento. Creado en colaboración entre la empresa Hewlett-Packard y las bibliotecas del Massachusetts Institute of Technology, el programa en sus inicios satisfizo las necesidades de estos centros de información pero luego se colocó a disposición de la comunidad internacional, como una herramienta open spurce, gratuita y de licencia GPL.

Se instala sobre sistema operativo Unix, que además necesita de la aplicación Java para su funcionamiento. Esta herramienta también incluye un sistema de bases de datos relacionales; este repositorio de colecciones digitales puede montarse sobre servidores Web PostgreSQL. Apache o Tomcat.

DSpace utiliza el estándar de metadatos Dublin Core para la descripción de los documentos, que van desde texto, hasta imágenes y videos, entre otros, y que luego posibilita su recuperación precisa. La interfaz en ambiente Web varía en dependencia de la persona que la utilice; así, los responsables de la colección tienen una, los administradores del sistema otra y los usuarios finales otra; aunque todas coinciden en que son en idioma inglés. Los usuarios pueden hacer sus búsquedas a partir de los metadatos declarados por los especialistas o simplemente mediante las listas de documentos por campos específicos, como son: autor, título y fecha.

Fedora5

Fedora es el acrónimo de Flexible Extensible Digital Object Repository Architecture (Arquitectura digital de repositorio de objetos digitales flexible y extensible). El repositorio de documentos digitales Fedora requiere de la instalación previa del programa Java en el servidor en el que funcionará; además, Fedora incluye en su paquete de instalación una base de datos que en caso de que los especialistas decidan no utilizarla, puede sustituirse por otras como Oracle y MySQL. Este software funciona con los sistemas operativos Windows y Unix y sobre servidores Web Apache y Tomcat.

Fedora, al ser un sistema open source gratuito, ofrece a los programadores su código fuente. Se distribuye bajo la Licencia de la Comunidad Educativa, que permite que el programa se propague a todos los que lo requieran y que se hagan modificaciones, siempre que se coloquen en forma visible los términos de esta licencia para que otras personas puedan conocer sobre ella.

El procesamiento de los documentos se realiza según los metadatos asignados por los especialistas en formato Dublin Core. La interfaz de presentación de Fedora es distinta para cada una de sus sesiones, es decir, una para el procesamiento de los documentos y otra para los usuarios finales, que además tendrán la posibilidad de recuperar los contenidos mediante búsquedas en varios índices, previamente declarados por los procesadores o mediante la navegación por las listas de las colecciones. Fedora permite crear colecciones digitales en varios formatos de documentos, como son: texto, imagen, sonido, etcétera. El lenguaje del programa, tanto de la interfaz de trabajo como de presentación a los usuarios, es en inglés, aunque es posible configurar, por medio de la agregación de aplicaciones adicionales que ofrece el sistema, el programa en varios idiomas.

CONTENTdm6

CONTENTdm provee herramientas para la organización, gestión, publicación y recuperación de colecciones digitales de todo tipo de documentos, desde texto (en varios formatos) hasta imágenes, videos y audio. Este programa se utiliza desde servicios Web; así los usuarios pueden ver los resultados desde sus navegadores Web, sin necesidad de instalar herramientas adicionales.

Los servidores en los que se instala CONTENTdm requieren de Windows Server, Linux o Solaris, además de servidores Web dedicados, montados en IIS con Windows o Apache. Las estaciones de trabajo de las personas que se ocupan de desarrollar las colecciones necesitan instalar Windows 2000 o superior para poder trabajar con el programa.

El procesamiento de los documentos con CONTENTdm se realiza según metadatos predefinidos, que los creadores de las colecciones pueden seleccionar, tanto entre los propios del programa como de Dublin Core. También permite exportar metadatos definidos en otras bases de datos de la institución que lo utilice, con vista a lograr una compatibilidad entre todas. CONTENTdm ofrece, además, un vocabulario controlado para la indización de los documentos, aunque permite que los usuarios utilicen otros, si así lo desean o necesitan. La recuperación de información se realiza mediante una interfaz Web, que presenta una descripción detallada de la colección y por medio de la que se puede hacer búsquedas por varios índices, como son: autor, título, materia, en el texto completo o como lo declaren los creadores. Los usuarios también pueden, si lo desean, navegar en la colección, por título, autores o como lo definan los creadores.

CONTENTdm es una herramienta paga, con licencia privada, que permite a los usuarios desarrollar sus colecciones a partir de los patrones que ellos definen, pero no pueden hacer ningún tipo de cambio o adecuación si lo necesitaran.

CONTENTdm soporta los lenguajes de los creadores y usuarios, y permite que se puedan construir colecciones en idiomas distintos al inglés.

Comparación de las herramientas

La descripción realizada anteriormente sobre las herramientas utilizadas para crear colecciones digitales se realizó según indicadores como interfaz, flexibilidad, lenguaje, procesamiento, recuperación, requerimientos de sistema, servidor Web, licencia, costo y contenidos.

El total de herramientas presenta variedad en su interfaz al ofrecer formatos diferentes, aunque en ambiente Web, para sus distintos momentos; así los administradores y procesadores poseen para su trabajo una interfaz y los usuarios finales pueden disfrutar de otra, que siempre es mucho más atractiva y que resulta amigable, para un buen uso de las colecciones. No obstante, DSpace trabaja solo en idioma inglés, aspecto en el que difiere del resto de las herramientas que se pueden configurar en múltiples idiomas, entre ellos en español.

Greenstone, DSpace y Fedora, al ser programas open source, gratis y con licencia pública, aunque Fedora se distribuye bajo Licencia de la Comunidad Educativa, todos ofrecen las mismas bondades de la licencia pública; permiten que los especialistas que los utilicen dispongan de su código fuente, a partir del cual pueden adaptar y mejorar sus programas. En este caso, CONTENTdm –al ser pago y con licencia privada– no es flexible con sus usuarios, que deben utilizarlo tal cual la empresa productora lo presenta.

Una coincidencia unánime en estas herramientas es la forma de procesar documentos; todas permiten asignar metadatos según estándares ampliamente distribuidos, como Dublin Core, aunque también brindan la posibilidad de que los especialistas declaren otros, si así lo necesitan o lo desean. CONTENTdm ofrece un vocabulario controlado que ayuda en la indización, además de la libertad de escoger el más idóneo, según las necesidades institucionales. Cabe decir, también, que tanto Greenstone, como DSpace, Fedora y CONTENTdm, permiten crear colecciones de distintos tipos de documentos como son: texto, en varios formatos, imágenes, audio, etcétera.

La recuperación en todos estos sistemas se realiza mediante varios índices, generalmente autor, título, materia y en el texto completo, así como por medio de la navegación en listas o por toda la colección, que pueden incluir la temática, autores, títulos u otros campos declarados por los creadores de la colección.

Los requerimientos de los sistemas que soportan estas herramientas son muy parecidos. Windows y Unix son los sistemas operativos que todos pueden utilizar, o al menos uno de ellos, además de instalarse en servidores Apache o Tomcat, como generalidad, con otras opciones disponibles. Los usuarios siempre pueden ver las colecciones en sus navegadores Web, sin necesidad de instalar otros programas para esta función.

Una vez comparadas todas las herramientas, puede afirmarse que CONTENTdm, por ser un sistema que requiere de pago y sin posibilidades de adaptación a las condiciones particulares de las instituciones, no es la herramienta apropiada para crear un repositorio digital en una institución promedio del área de la salud en Cuba.

DSpace tampoco es el programa que requieren esta clase de instituciones porque, tanto su área de procesamiento como la de presentación a los usuarios, es en idioma inglés, y sin posibilidades de configurarlo en otro idioma.

Entonces, si se analiza con profundidad Fedora y Greenstone, el primero –si bien ofrece la posibilidad de configurarlo en español– es necesario instalarle otras aplicaciones para lograr este objetivo, mientras que el segundo, en su instalación principal, brinda la posibilidad de declarar el idioma deseado desde el principio. Además, aunque ambas herramientas tienen una amplia comunidad de creadores alrededor del mundo, Greenstone posee mayor cantidad en idioma español, así como la documentación propia del programa, los artículos y otros documentos son más comunes en idioma español.

Otra ventaja de Greenstone sobre Fedora es que Infomed emplea este software para la creación de colecciones digitales, y si otras instituciones lo utilizan, se garantiza continuidad y compatibilidad en el trabajo del sistema de información en salud. Así, entonces, Greenstone parece ser la opción de elección para crear colecciones digitales en una institución promedio de salud en Cuba.

Referencias bibliográficas

1. Infomed. Manual del 2do Taller sobre Greenstone Digital Library. Creación de colecciones digitales. La Habana: Infomed; 2005.

2. Garrido P, Tramullas J. Un experimento de creación de biblioteca digital con Greenstone . El Profesional de la Información. 2004;13(2). Disponible en URL: http://greenstone.docunautica.com [Consultado: 22 de marzo del 2006].

3. Smith M, Barton M, Bass M, Branschofsky M, McClellan G, Stuve D, et al. DSpace. An Open Source Dynamic Digital Repository. D-Lib Magazine. 2003;9(1). Disponible en URL: http://www.dlib.org/dlib/january03/smith/01smith.html [Consultado: 15 de abril del 2006].

4. Zarama R, Medaglia A, Rosero Bernal V, Yamid Méndez C, Arciniegas M. Tutorial de DSpace V 1.2. Disponible en URL: http://dspace.uniandes.edu.co:5050/dspace/bitstream/1992/770/1/Tutorial+de+DSpace+nov+05.pdf [Consultado: 19 de abril del 2006].

5. The Fedora Development Team. Introduction to Fedora. Tutorial # 1. Disponible en URL: http://www.fedora.info/download/2.1/userdocs/tutorials/tutorial1.pdf [Consultado: 21 de abril del 2006].

6. CONTENTdm Digital Collection Software. CONTENTdm Features. Disponible en URL: http://contentdm.com/products/features.html [Consultado: 20 de marzo del 2006].

Recibido: 9 de mayo de 2006. Aprobado: 20 de mayo de 2006.
MSc. Yanetsys Sarduy Domínguez. Escuela Nacional de Salud Pública. Calle I # 202 % Línea y 11. Vedado, Ciudad de La Habana, Cuba. Email: yanetsys@ensap.sld.cu

1Máster en Bibliotecología y Ciencias de la Información. Escuela Nacional de Salud Pública.
2Licenciado en Relaciones Internacionales. Director del Centro Nacional de Información de Ciencias Médicas-Infomed.

Ficha de procesamiento

Términos sugeridos para la indización

Según DeCs1

AUTOMATIZACIÓN DE BIBLIOTECAS; PROGRAMAS DE COMPUTACIÓN.

LIBRARY AUTOMATION; SOFTWARE.

Según DeCI2

BIBLIOTECA DIGITAL; PROGRAMAS DE COMPUTADORA.

DIGITAL LIBRARY; SOFTWARE.

1BIREME. Descriptores en Ciencias de la Salud (DeCS). Sao Paulo: BIREME, 2004.

Disponible en URL: http://decs.bvs.br/E/homepagee.htm

2Díaz del Campo S. Propuesta de términos para la indización en Ciencias de la Información. Descriptores en Ciencias de la Información (DeCI). Disponible en URL: http://cis.sld.cu/E/tesauro.pdf