Introducción
Las ontologías son sistemas de organización del conocimiento, considerados bases de la Web Semántica. Las ontologías permiten, a la vez, realizar deducciones sobre los mismos conocimientos que describe, expresándolos de manera consensuada, legible por las computadoras y comprensible por los seres humanos, los cuales son sus principales administradores y consumidores. Además, las ontologías son un producto reutilizable y de estructuras entendibles, capaces de establecer relaciones entre los conceptos que este recurso trata, perfeccionando la perspicacia humana en el creciente paradigma digital.
Los proyectos de Humanidades Digitales incorporaran el uso de ontologías, como es el caso de los desarrollados por el Online Computer Library Center (OCLC)1 el cual utiliza una API de Metadatos2 para añadir y actualizar datos bibliográficos de los registros que posee en el catálogo en línea de acceso público WorldCat, para mantener las propiedades de la información y crear redes. Otro ejemplo es el proyecto que dio origen a la International Encyclopedia of the First World War, elaborado por la Universidad de Berlín y el Centro para Sistemas Digitales de esa misma institución a finales del año 2017, como parte del cual se construyó una ontología para la descripción e interrelación de la entrada con otros contenidos de la enciclopedia (Alcaraz, 2018: 5).
El proyecto HDCICuba tiene como misión el desarrollo de investigaciones que exploren los vínculos entre las Humanidades Digitales y las Ciencias de la Información, aplicados a la cultura y la ciencia cubana, su historia y su tradición. En la actualidad el Grupo de Investigación Académica HDCICuba ha desarrollado las investigaciones de tesis, continuando con dicha misión, sobre el análisis y digitalización de las marginalias del Che Guevara y la representación ontológica del poemario “En la Calzada de Jesús del Monte” de Eliseo Diego. Esta última en conmemoración del centenario del autor y de los 71 años cumplidos desde la primera impresión de la obra mencionada, poemario insignia de la literatura cubana.
Si bien las ontologías son recursos de representación del conocimiento de uso extendido en proyectos de humanidades digitales, no se encontró en Cuba ningún proyecto de este tipo que tenga como objetivo una representación ontológica de la obra poética “En la Calzada de Jesús del Monte”, de Eliseo Diego. Esta investigación se trazó como objetivo realizar una representación ontológica de la obra poética mencionada usando un modelo ontológico para la poesía y herramientas automáticas de extracción de información.
Desarrollo
La investigación está interesada en las características de las ontologías, sus componentes, aplicaciones, entre otros elementos, así como los aspectos que relacionan este recurso con las Humanidades Digitales y las infraestructuras desarrolladas desde esta área, así como exponer la vida de Eliseo Diego y su obra. A partir de esto, se hace un análisis de verso para la identificación de las principales categorías y conceptos asociados para realizar una representación ontológica del primer poemario editado de ese autor cubano.
Para la confección de este estudio se utilizaron los siguientes métodos y herramientas:
Análisis de contenido: Su aplicación se utilizó para la identificación, examen y valoración de la bibliografía relacionada con la investigación, lo que permitió comprender la información para el desarrollo de este estudio.
Análisis Lingüístico: Se empleó para la deconstrucción terminológica de los poemas que conforman el texto seleccionado a analizar utilizando las herramientas automáticas de extracción de información. Específicamente para la obtención y contabilización de los principales componentes de la obra.
Análisis métrico y prosódico: Se utilizó para el análisis de los versos pertenecientes al poemario objeto de estudio, para la obtención de los datos descriptivos utilizando herramientas de extracción de información. Se empleó la metodología establecida por el Manual de la Métrica Española de Masters Jan Darebný y Daniel Vázquez Touriño de la Universidad Masaryk. - Simple Knowledge-Engineering Methodology: Para el diseño de la ontología se usó la propuesta de Noy, N. y McGuinness, D. (2001).
Herramientas:
PoetryLab: es una herramienta perteneciente al proyecto POSTDATA, en la UNED, utilizada para el análisis de versos y la obtención de los datos descriptivos para la confección de la ontología.
ANALHITZA: es una herramienta desarrollada por el Grupo Ixa, de la Universidad del País Vasco para el procesamiento automático de textos. Cuenta con procesadores en cadenas modulares lingüísticas, los cuales le confieren a la herramienta la capacidad de procesar información mediante el uso de tecnologías de fácil manipulación. Esta herramienta de PLN permite obtener datos lingüísticos referidos a los nombres, tanto personales como de lugares, adjetivos, verbos, adverbios. Realiza un conteo de secuencias de hasta dos, tres o cuatro palabras.
VoyantTools: Se empleó para el análisis terminológico del texto, facilitar la comprensión y la lectura del mismo. El análisis inmediato que ofrece va desde una nube de etiquetas, una gráfica de frecuencia de los términos y el contexto de una palabra hasta un resumen general del documento. Ofrece datos como las palabras más frecuentes, la cantidad de palabras que contiene el texto y la densidad de vocabulario del texto. Los análisis que resultan de cada herramienta se pueden descargar y compartir de distintas formas, dependiendo de cada herramienta, ya sea como archivos de imágenes para las visualizaciones, como texto plano para luego hacer otros análisis o como código html para embeberlo en una página.
EndNote X7: Gestor bibliográfico utilizado para la confección de las referencias bibliográficas, apoyado por el estilo bibliográfico American Psychological Association (APA, 6ta Edición).
Protégé: Es un editor gráfico de ontologías, interactivo y de código abierto. Cuenta con el apoyo de una sólida comunidad de usuarios de instituciones académicas, gubernamentales y corporativas, que utilizan el software para crear soluciones basadas en el conocimiento en áreas tan diversas como biomedicina, comercio electrónico y modelado organizacional.
OWL: Lenguaje seleccionado para la representación ontológica. Fue creado en el año 2002 por el Grupo de Trabajo integrador de la World Wide Web (WWW). Es el lenguaje más usado para el desarrollo y construcción de Ontologías en la Web Semántica. Se encuentra integrado al Protégé, junto con RDF Schema y XML.
I. Ontologías. Aplicación y metodología
Ámbitos de aplicación
A las ontologías se le han conferido un mayor uso en las áreas de la ingeniería, principalmente la ingeniería del conocimiento, la inteligencia artificial y la organización del conocimiento, especialmente en los proyectos digitales que incluyan el procesamiento automático de textos.
En el ámbito del Procesamiento del Lenguaje Natural, las ontologías se están empleando para construir representaciones independientes de la lengua que puedan servir de punto de encuentro entre dos o más lenguas naturales. En este sentido la ontología se considera como el repositorio de conceptos que establecen conexiones entre los símbolos de una lengua y sus referentes en el mundo o submundo que se contempla. (Pérez, 2002)
Siguiendo con las diversas aplicaciones de este recurso García Hernández (2005) expone que las ontologías son muy usadas por los sistemas de información, siendo aplicadas para la integración, como parte de la cooperación entre los sistemas y los datos que estos poseen en sus determinadas plataformas y soportes. Este recurso influye de manera importante en la normalización de los contenidos. Presenciadas, primordialmente en el ambiente documental, debido a la legibilidad, comprensión, identificación y representación de los términos y conceptos.
También, esta herramienta es utilizada desde la ingeniería del conocimiento, formando modelos y esquemas de información y conocimiento. Desde sus usos, restricciones, relaciones que en sí permiten esclarecer los conceptos que abordan esta ingeniería.
Este recurso permite, como plantean Díaz, Joyanes y Medina (2009: 252), el compartir conocimiento y realizar trabajo colaborativo, pues funciona como plataforma común entre organizaciones y comunidades científicas. Abad (2017) apoya esa perspectiva, al considerar que uno de los beneficios adicionales del uso de ontologías tiene que ver con la reutilización de conocimiento.
De acuerdo con los autores mencionados anteriormente, se puede decir que, gracias al conocimiento almacenado en las ontologías, las aplicaciones podrán extraer automáticamente datos de las páginas web, procesarlos y sacar conclusiones de ellos, así como tomar decisiones y negociar con otros agentes o personas. (Díaz, Joyanes y Medina, 2009: 253)
Lamarca (2013) realiza una aproximación sobre las posibles aplicaciones que poseen las ontologías, como son:
Repositorios para la organización del conocimiento.
Servir de herramienta para la adquisición de información.
Servir de herramientas de referencia en la construcción de sistemas de bases de conocimiento que aporten consistencia, fiabilidad y falta de ambigüedad a la hora de recuperar información.
Normalizar los atributos de los metadatos aplicables a los documentos.
Crear una red de relaciones que aporte especificación y fiabilidad.
Permitir compartir conocimiento.
Posibilitar el trabajo cooperativo al funcionar como soporte común de conocimiento entre organizaciones, comunidades científicas, etc.
Permitir la integración de diferentes perspectivas de usuarios.
Permitir el tratamiento ponderado del conocimiento para recuperar información de forma automatizada.
Permitir la construcción automatizada de mapas conceptuales y mapas temáticos.
Permitir la reutilización del conocimiento existente en nuevos sistemas
Permitir la interoperabilidad entre sistemas distintos.
Establecer modelos normativos que permitan la creación de la semántica de un sistema y un modelo para poder extenderlo y transformarlo entre diferentes contextos.
Servir de base para la construcción de lenguajes de representación del conocimiento.
Este sistema de representación de conocimiento tiene un alto ámbito de aplicación en la traducción y representación artística y patrimonial de diversas obras. Su nivel de comprensión, aplicación y estructura de dominio ha permitido ser utilizada como componente de transmedia; en materias como la medicina, la ingeniería civil, estudios de prensa, entre otros. Son aprovechadas sus ventajas como recurso y su capacidad adaptativa en el ámbito de la web semántica. La interactividad y dinamismo web de las ontologías como infraestructura es novedosa, por lo que han sido adoptadas como un recurso idóneo. Son tomadas como base para el rescate, preservación y representación de contenidos y conocimientos científicos e incluso patrimoniales.
Metodologías
Las ontologías son llevadas a cabo por diferentes desarrolladores que aplican una serie de pasos metodológicos para el diseño de la misma. Estas metodologías están pautadas para preservar la construcción, evolución, evaluación y reutilización del sistema confeccionado. De esto deviene la no existencia de una metodología estándar. Cada metodología creada se ajusta a los requerimientos necesarios para el desarrollo de ontologías, además, de que los diseñadores de estos sistemas establecen nuevos pasos que completen con exactitud el proceso de construcción y organización de dicho recurso. Mientras, entre sus pasos metodológicos, respeten los criterios y características, y se contemplen la adecuada organización y comprensión de sus componentes. De esta forma, la aplicación de las metodologías de diseño y desarrollo de ontologías posibilita el correcto desempeño del recurso y la comunicación entre este y otras ontologías.
El trabajo interdisciplinario de construcción de una ontología es complejo en sí, por lo que se han desarrollado metodologías que se adaptan a la forma en que se crea la ontología. Algunas de estas, se encuentra dirigidas a la organización del recurso, otras al software y otras al resultado como finalidad, mantención y reutilización.
Barber, E. et al, (2018: 22) expone, a partir de lo mencionado por Tonkin, Pfeiffer y Hewson (2010), diferentes tipos de metodologías que se diferencia por la forma en que se construyen las ontologías:
En primer lugar, las auto-reflexivas en las que, dadas las características acotadas del dominio, una sola persona aborda el diseño sobre la base de los conocimientos que posee. En segundo lugar, las colaborativas, convenientes cuando debe abordarse un dominio extenso que exige considerar múltiples facetas y consensuar puntos de vista de individuos con conocimientos especializados y diferentes. Por último, las empíricas que toman como punto de partida los datos registrados en documentos de interés en función del dominio elegido.
La variedad de autores que han desarrollado metodologías se han especializado en un dominio ontológico específico. Sin embargo, estos no se desenlazan del objetivo que se desea alcanzar y el resultado de dicha producción. Por lo que, estas metodologías comparten en su estructura pasos similares.
Una de las metodologías aplicadas al proceso de construcción de ontologías más reconocida, posterior a la extensión de la web, es la Metodología de Uschold y King en el año 1995, orientada al proceso modelo de las empresas, estipulada por estrategias de organización y jerarquía. La cual contiene cuatro pasos lógicos que conforman la construcción, evaluación y documentación del sistema creado:
Sin embargo, la Metodología TOVE, creado por Grüninger y Fox (1995), a diferencia de la anteriormente mencionada, está más orientada hacia la competencia que tendrá el recurso en su contexto de aplicación inmersa en su misma estructura. La Metodología TOVE fue desarrollada para el dominio de las actividades comerciales y modelos de negocios, aplicada a la empresa Toronto Virtual Enterprices. Esta metodología, al igual está conformada por cuatro pasos lógicos:
Determinar la competencia de la ontología
Definir la terminología de la ontología
Especificar las definiciones y restricciones de la terminología
Probar la competencia de la ontología para demostrar la integridad de las teorías
A partir de estas dos metodologías surgieron una variedad que le aportaron determinados pasos o especificaciones en base a perfeccionar la estructura lógica para el desarrollo de ontologías, dígase: la Metodología Amaya (1996), Metodología SENSUS (1999), Metodología JADE (2003), entre otras. Cada una de estas metodologías expone una nueva comprensión de los pasos lógicos de su antecesora, una interpretación didáctica de sus pasos.
Entre las metodologías más difundidas por su nivel de completitud en el proceso de construcción de ontologías es la denominada Methontology, creada por Fernández-López, Gómez-Pérez y Juristo en el año 1997 en el Laboratorio de Inteligencia Artificial de la Universidad Politécnica de Madrid. Esta ontología está especialmente guiada para empezar el proceso de diseño desde cero, con el uso de la reingeniería y la interacción con otras ontologías. Dictaminada para una comprensión sin experiencia previa y para diversos dominios. Estos métodos incluyen tres flujos: La fase de dirección, la fase de desarrollo y la fase de mantención (Hongyan, Y. et al, 2011). Cuenta con siete pasos lógicos y bien estructurados:
Especificación
Adquisición de conocimiento
Conceptualización
Integración
Implementación
Evaluación
Documentación
A partir de observar los pasos y el análisis a las metodologías expuestas anteriormente se pueden identificar los procesos fundamentales que intervienen en la construcción de las ontologías. Procesos que son medulares entre los pasos lógicos y el ciclo de vida de la creación de estos sistemas de representación de conocimiento:
Identificar el dominio y el alcance de la ontología: permite que se determine el área de conocimiento que se desea representar y la finalidad potencial a la que está dirigida el recurso.
Construcción de la ontología: compete a la adquisición del conocimiento y la terminología que da paso a la codificación y formalización de la ontología. Teniendo en cuenta, la integración con otros recursos similares.
Evaluación de desempeño: se prueba las competencias de la ontología en un contexto de usuario. Potencial para determinar funcionamiento, errores y calidad.
Documentación: estipulación documental de las formas, herramientas y técnicas que se utilizaron para la confección de la ontología. Como también, los resultados de su evaluación.
Metodología: Simple knowledge - engineering methodology
Otra de las metodologías más representativas es la diseñada por Noy y McGuinness (2001), titulada Simple knowledge-engineering methodology. Es una guía minuciosa y simple, sin eximir su complejidad, para la confección de ontologías. Fue creada en la Universidad de Stanford por el grupo desarrollador del software Protégé 2000. Esta metodología está concebida a partir de la experiencia en el uso de herramientas como Ontolingua 1997, Chimaera 2000 y el Protégé 2000, como aplicación ideal. Es una metodología que cuenta en cada uno de sus pasos de nivel de detalle dirigidos a la formalización de la ontología sin abstener dominios. De tal forma, Noy y McGuinness establecen que, para la formación estructural de la ontología, los sustantivos y verbos son la base para determinar las clases y las relaciones, lo que potabiliza el proceso de decisión en la usabilidad en un futuro. Confiriéndole una importancia vital a la implementación de términos para la confección del recurso con el software idóneo para su desarrollo. Autores como Ramírez, Z., (2006) y Hongyan, Y. et al, (2010) la consideran como la metodología más específica que se ha desarrollado3. Cuenta con los siguientes pasos lógicos:
Determinar el dominio y alcance de la ontología.
Considerar la reutilización de ontologías existentes.
Enumerar términos importantes en la ontología.
Definir las clases y las jerarquías.
Definir las propiedades de las clases.
Definir las facetas.
Crear instancias.
Debido a la existencia de diversas metodologías de desarrollo de ontologías, se ha optado por la descripta anteriormente ya que se adapta mejor a los requerimientos de modelado, desde el punto de vista de la simplicidad y completitud de la misma.
II. Desarrollo de la ontología propuesta
La metodología analizada anteriormente establece una serie de pautas para el desarrollo de la ontología a realizar. Se crea así un sistema de estandarización con aspectos filológicos y tecnológicos desde el análisis propuesto por el campo de las Humanidades Digitales que establece una comunicación sana entre las tradiciones literarias y culturales, y la tecnología. La misma se posibilitó con el cumplimiento de dichos pasos que respeten las características y criterios de las ontologías como infraestructuras de las Humanidades Digitales.
Dominio y alcance de la ontología
Se confeccionaron estudios analíticos e interpretativos sobre Eliseo Diego y la Calzada de Jesús del Monte. Estos análisis exponen detalladamente un estudio en profundidad del dominio a contemplar en la ontología. Se desencadenan los principales componentes que forman y completan el texto a representar en el sistema. Además, se examinó y estudió hermenéuticamente la obra, como también los datos que circulan alrededor de esta: Edición y publicación, reseña de su contenido, críticas realizadas por autores y estudiosos relevantes al tema, entre otras cuestiones de importancia. El autor fue observado como parte de este estudio. Figura creadora y ente primordial al analizar e interpretar dicho texto. Para este se vislumbraron sus datos bibliográficos y su compromiso literario - poético para comprender tanto sus formas al escribir, su posición ante la vida mediante su propia literatura, como su honesta opinión acerca de los contenidos de esta obra en sí y del grandilocuente contenido literario que el escritor produjo y desarrolló.
La ontología diseñada mediante la obra poética de Eliseo Diego, “En la Calzada de Jesús del Monte”, persigue lograr los siguientes objetivos a partir de su desarrollo y exposición:
Construir un sistema de organización y representación de información accesible por tecnologías modernas que permita la comunicación, comprensión y recuperación de la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego.
Posibilitar la exploración y navegación por la estructura del sistema perteneciente a la ontología mediante la visualización de sus conceptos, relaciones y componentes.
Facilitar el acceso y la reutilización de la ontología como herramienta para la comprensión, traducción e interpretación de la información contenida en el sistema como reflejo de la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego.
La ontología que se confeccionó representa los principales criterios que se establecen. Desarrollado como un sistema claro en sus componentes, versátil en su funcionamiento, coherente, alejado de una extensibilidad prolongada e innecesaria. Su margen de error y sesgo de codificación se procura que sea mínimo a su desarrollo, previendo el conocimiento que representa del ente objeto de estudio en su totalidad.
El sistema de representación y organización de la información que se realizó es considerado como una Ontología de Dominio. Especificado según Guarino4 en que estas: describen conceptos relativos a un determinado dominio o área de conocimiento. Aunque, esta posee características de las Ontologías Lingüísticas y Terminológicas. Las primeras se observan como aquellos sistemas que modelan el lenguaje natural, en cambio, las segundas se desarrollan a partir de los términos que son estudiados y posicionados para representar un conocimiento. A través de esto, se logra una comprensión óptima en su descripción. A su vez, ubican al dominio objeto de estudio dentro del mismo dominio de conocimiento al que pertenece.
La ontología sobre la obra “En la Calzada de Jesús del Monte” establece una conexión entre los estudios de la lengua inmersos en ella y los referentes al dominio en que este texto se desarrolló. Esta ontología funge como aproximación, desde la Lingüística y las Ciencias de la Información, de la obra representada. Por lo que, dicho sistema es competente para ser usado como un recurso que facilite la comprensión del mundo que crea Eliseo Diego en su poemario. El recurso desintegra de forma armónica los conceptos abstractos y concretos fundamentales que entrelazan el enramado del texto, sin perder esa característica de totalidad del corpus. Naturalmente, los conceptos describen diferentes formas de observación, percepción e interpretación de la realidad. Teniendo en cuenta, los análisis necesarios sobre informaciones referenciadas y lugares inmersos en el texto. La ontología fue establecida en un lenguaje natural, sin desarticular los esquemas y dialectos expresados por el autor de la obra. Sin embargo, Noy y McGuinness (2001) sugieren que: en el caso que las personas que mantendrán la ontología describen el dominio en una lengua que es diferente de la lengua de los usuarios de ontología, entonces se proveerá de un levantamiento de planos entre las lenguas.
Reutilización de ontologías existentes
Según lo expuesto anteriormente, se diseñó una ontología que represente la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego. Por lo tanto, para el desarrollo de la misma era necesario obtener y vincular al modelo de este sistema, la herramienta óptima. Para esto se seleccionó aplicar mediante los resultados de los análisis previstos y un modelo ontológico del dominio propuesto por POSTDATA, este sistema en la herramienta digital Protégé en su versión 4.3. Sin embargo, no se importó otra ontología dentro del entorno de desarrollo del sistema creado, desvinculando una interacción a aplicaciones que diseñan otras ontologías en particular.
El editor gráfico e interactivo de código abierto Protégé es una herramienta útil para la confección de ontologías de dominio. Fue desarrollado por el grupo: Stanford Medical Informatics (SMI) de la Universidad de Stanford, EU. Es una aplicación stand-alone que pertenece al movimiento open source (Ramírez, 2006: 63). Posee una arquitectura extensa con bases de conocimiento en disposición del usuario. Este software editor brinda mediante una biblioteca de programas aplicables diferentes mecanismos para visualizar las ontologías creadas, inferencias y la obtención de información y conocimientos en y para los mismos recursos que se diseñen. Ofrece también, la integración y relación automática de otras ontologías potabilizando el trabajo a los usuarios. Además, el mismo se encuentra soportado en un lenguaje ontológico, como pueden ser: RDFS, OWL y XMLS, con traductores para los lenguajes FLogic, OIL, Ontolingua y RDFS. (Anexo 1. Editor Gráfico Protégé, versión 4.3)
Por lo tanto, la ontología diseñada para la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego se confeccionará en un lenguaje OWL, proporcionado por el software en sí.
Enumeración de términos importantes en la ontología
Se realizó un análisis lingüístico y terminológico de la obra que va un paso más allá en profundidad, mediante el uso de herramientas de procesamiento terminológico, métrico y prosódico. Este desintegra el texto en sus componentes básicos, primordiales y primitivos a su composición, los atributos textuales que utiliza. Arroja el estudio literario, métrico y prosódico en que fue escrita y expuesta la redacción de la obra, apoyada por los resultados del software PoetryLab, como también, se desmenuza en sus elementos narrativos e instancias literarias el texto, en: sustantivo, adjetivo, preposiciones, conjunciones, etc.
El análisis lingüístico posibilitó completar la ontología diseñada con los términos relevantes que conforman la simbología principal de la obra. A partir de esto se creó una Clase tildada como Imaginario, en donde se representan los términos que ejemplifican las abstracciones, directas e indirectas, que el autor narra en el texto, sin perder el sentido original de la palabra ni su concepto básico. Entre las herramientas de procesamiento de lenguaje natural utilizadas para desarrollar dicho análisis, el ANALHITZA, otorga los principales resultados terminológicos que engrosaron la estructura de la ontología. Teniendo en cuenta las entidades nombradas, ítem que contiene la contabilidad de los nombres propios que se utilizaron en la obra. Tales entidades nombradas conformaron las Clases de contenido de la ontología, tratándose de: Lugares, Religión, Personajes Arquetipos e Historia. También, este análisis lingüístico - terminológico fue contemplado dentro del sistema creado al ser abordado por la Clase: Lingüística. Dicha clase forma parte del constructo particular de la obra, observándose, forma, contenido y estructura. Equivalente a las clases: Métrica y Discurso. Estas clases se encuentran contenidas dentro de la clase principal: Estructura. Como también, los términos asociados a Apreciaciones Temporales y Emociones. (Anexo 2. Tabla de términos representativos)
Ambos análisis fueron contribuyentes para formar las clases, relaciones formales y conceptuales de la ontología. Destacando las diversas desambiguaciones en que se puede observar la obra como sus aspectos más formales y lingüísticos. Estos dos análisis al ponerse en contraposición al texto mismo le otorgan un nivel de comprensión totalitario y complejo. Es capaz de potabilizar y traducir a un lenguaje interesante y en completitud la obra misma.
Definición de las clases y las jerarquías
Para la construcción de la ontología es necesario establecer una taxonomía básica que organicé jerárquicamente las principales categorías. Para esto se siguieron las pautas indicadas en el análisis metodológico del trabajo investigativo de Centelles, M. (2005): “Taxonomías para la categorización y la organización de la información en sitios web”. El cual indica que posteriormente a determinar la realidad o área cognitiva que se desea representar, se debe realizar el estudio y obtención de las categorías y términos que reflejan dicha realidad. Para reflejar el estado esencial de lo que se deseó construir, se creó un modelo ontológico que representa las principales categorías que debe poseer el diseño de la ontología (Anexo 3. Modelo ontológico para la Poesía Cubana). Se pretende que dicho modelo se adapte a posteriores trabajos investigativos que aborden una temática similar.
Como se presentó, para ambas pautas expresadas por Centelles, M. (2005), se tomó como referente los estudios realizados en la presente investigación, soportado por la implementación de las herramientas PoetryLab, VoyantTools y ANALHITZA. Este estudio permitió que se determinara 1 Superclase: En la Calzada de Jesús del Monte (asociada a la obra). Esta entidad contiene a su vez, de forma jerárquica y arbolea, 5 clases principales: Fuente Primaria (asociada a la conformación estética y contextual de la obra impresa), Comentarios (asociado a los contenidos externos referentes a la obra), Creador (asociado a las entidades responsables de la obra; Eliseo Diego y Grupo Orígenes, grupo al que pertenecía el autor y responsable de publicar dicha obra), Estructura y Corpus (se refieren a la forma en que se estructuró la obra y el contenido de la misma), 19 subclases de nivel 1, 10 subclases de nivel 2 y 2 subclases de nivel 3. Estas clases completan la realidad del texto. A continuación, se expone los principales componentes categóricos de la ontología desarrollada:
En la Calzada de Jesús del Monte
Comentarios: Entidad diseñada para exponer diferentes textos externos que son necesarios como parte del análisis de la obra poética "En la Calzada de Jesús del Monte" de Eliseo Diego.
Reseña: Entidad diseñada para exponer una reseña literaria de la obra poética "En la Calzada de Jesús del Monte" de Eliseo Diego.
Resumen: Entidad diseñada para exponer el resumen de la obra poética "En la Calzada de Jesús del Monte" de Eliseo Diego.
Crítica: Entidad diseñada para exponer una variedad de críticas realizadas a la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego.
Corpus: La entidad comprende las diferentes categorías de contenido que conforman la obra en sus disímiles rasgos literarios.
Apreciaciones Temporales: Entidad diseñada para representar las formas en que el autor asocia temporalmente la obra. Se observa cada término que desambigua una línea de tiempo en el texto en sí del poemario. Teniendo en cuenta las aserciones simbólicas tanto abstractas como en su componente concreto.
Historia: Entidad diseñada para contener los apartados que definen los elementos históricos utilizados en la obra En la Calzada de Jesús del Monte.
Imaginario: Entidad diseñada para expresar aquellos términos que fungen como conexiones simbólicas y abstractas en todo el enramado del poemario. Incluso, algunos profesan como sujetos principales de la forma de narrar del autor.
Lugares: Entidad creada para exponer los diferentes lugares y locaciones contenidas en la obra como parte del texto.
Personajes Arquetipos: Entidad creada para representar a los diversos personajes arquetipos presentes por el autor en la obra En la Calzada de Jesús del Monte.
Religión: Entidad creada para exponer a las diferentes aserciones o entidades religiosas que el autor emplea para desarrollar la obra En la Calzada de Jesús del Monte, ya que el mismo era practicante de la religión católica.
Emociones: Esta entidad muestra las emociones esclarecidas y representativas que él expone en su texto. Eliseo Diego, en sus obras, se hace una fuerte empatía entre la melancolía, la tristeza, la felicidad, la nostalgia, el amor.
Creador: La entidad comprende los diferentes componentes elementales que conforman los organismos responsables de crear determinados recursos.
Estructura: Entidad diseñada para expresar la estructura formal y organizativa de la obra En la Calzada de Jesús del Monte de Eliseo Diego. Dividida en diferentes componentes que comprenden el texto en su totalidad.
Discurso: El autor hace homenaje a su calzada mediante una variedad de discursos en donde comenta sus apreciaciones sobre esta, sus vivencias, entre otros argumentos que conforman el texto: Primer Discurso, Segundo Discurso. Estos textos son los primeros poemas que conforman la obra poética y en sí, resumen el contenido de la misma.
Lingüística: Entidad diseñada para expresar el análisis lingüístico realizado a la obra En la Calzada de Jesús del Monte de Eliseo Diego. Dividida en diferentes componentes que comprenden el texto en su totalidad.
Métrica: Entidad creada para expresar la métrica del poemario En la Calzada de Jesús del Monte.
Fuente Primaria: Entidad diseñada para expresar las características de la fuente primaria de la cual deviene la información, sea un documento, autografía, manuscrito, libro impreso, etc. En este caso es el poemario impreso En la Calzada de Jesús del Monte, de Eliseo Diego.
Conjunto: Entidad diseñada para expresar las características abstractas y conceptuales de la cual deviene la información, en el poemario impreso En la Calzada de Jesús del Monte, de Eliseo Diego.
Aparato: El registro de alguna variante y las notas adicionales relacionadas con la lectura. Por ejemplo, el comentario analítico del editor u otra personalidad.
Ilustración: Retrato, pintura, imagen o letra decorativa en un manuscrito iluminado. Cualquier ilustración en el material impreso.
Paratexto: Entidad creada para expresar algún tipo de texto que soporte al texto principal, por ejemplo: marginalias, dedicatorias, etc.
Definición de propiedades de las clases
Para el estudio de los términos obtenidos y la interpretación de las acepciones del autor, para asignar propiedades a las clases, se presentó el apoyo documental de varios volúmenes que completaran la información para la comprensión del poemario. Estos volúmenes documentales están compuestos por: Santa Biblia. Antiguo y Nuevo Testamento. (1960), Diccionario de la Real Academia Española (http://www.rae.es/), Historia de Cuba. 1492 - 1898. Formación y liberación de la nación. (2001), Historia de Cuba. 1899 - 1958. Estado Nacional, dependencia y revolución. (2012), y enlaces digitales utilizados para el esclarecimiento de información, principalmente sobre los lugares indicados en el producto resultante.
Con los exámenes a la obra poética, como texto principal, y al cúmulo de documentos de apoyo, se posibilitó un control terminológico como tercera pauta establecida por Centelles, M. Esto permitió la confección de las primeras clases, subclases y sus relaciones. Teniendo en cuenta la comparación significativa de ciertos términos y la visión artística - literaria del autor del poemario. Esto posibilita que los términos representativos tengan propiedades adecuadas que definan las clases a la que pertenecen. (Anexo 4. Propiedades del dominio)
Definición de las facetas y creación de instancias
Se estableció las relaciones conceptuales y de equivalencia posibles entre los términos y categorías extraídas de los estudios. Identificando así, los términos que se aseguran bajo un mismo concepto y propiedad en algunas ocasiones, como, por ejemplo: el sustantivo muerte que posee elocuencia literaria con los términos polvo, noche y oscuridad. Desde el punto de vista de estas tres últimas palabras, la muerte se denota con el paso del tiempo, la suciedad y la falta de esperanza y visión que proviene de la misma oscuridad.
Las facetas en la ontología realizada están determinadas por las propiedades de las clases e instancias que se crearon. Estas instancias son las entidades concretas que representan a una clase en específico del dominio y las relaciones entre estas, sean jerárquicas, de equivalencia, o simplemente individuales. Estas instancias están primordialmente figuradas en la ontología por las subclases que se determinaron para abarcar el contenido e interpretación del texto. Por ejemplo, el caso de: Imaginario, el cual se encuentra definido por las instancias o subclases, Elementos, Representaciones e Intangibles; y Lugares, con las instancias Ciudades, Locaciones, Escenarios y Repartos. Esto tiene constancia al igual en el Anexo 2. Tabla de términos representativos.
El control terminológico otorga la capacidad de ponderar sobre los términos que abarcan correctamente el dominio que se desea representar en las ontologías. Establece las relaciones necesarias de similitud o parentesco, jerarquía y equivalencia entre las instancias y conceptos que se estructuran de forma consistente en el esquema de la taxonomía.
Centelles, establece como última pauta la determinación del esquema y estructura de organización de la taxonomía como base de la ontología a desarrollar. Dicho esquema se realizó de forma tal que complete la realidad de la obra poética de Eliseo Diego en su totalidad. En un índice jerárquico de lo general a lo particular. Teniendo en cuenta que los elementos de la ontología se tomaron sobre la base de la generalidad expuesta en el texto del poemario, con el objetivo de abarcar todo el dominio de conocimiento. Lo cual no se exime de modificaciones.
La figura 1 muestra las principales clases y subclases de la taxonomía que sirve de base al desarrollo de la ontología.
Modelación de la ontología
La modelación de la ontología se desarrolló con el software mencionado anteriormente. Teniendo en cuenta el lenguaje seleccionado al confeccionar el sistema: OWL. El vocabulario en que fue desarrollada fue introducido en español, aunque las instancias que representan los elementos devienen en inglés del mismo software que se empleó.
Se reconoce por el identificador: ontology_eliseo. Fue creada y desarrollada en el mes de Julio del presente año. Esta respeta las macrocategorías y categorías en forma jerárquica expuestas en epígrafes anteriores. Mantiene a su vez, las relaciones semánticas determinadas entre los términos organizados de manera irrepetible. Diseñada en un orden de arriba hacia abajo sin rechazo terminológico. En la figura 2 se muestra el esquema relacional resultante de la confección de la ontología diseñada en el software Protégé:
Consideraciones finales
Las ontologías son recursos, necesarios, eficaces, dinámicos e interactivos que facilitan el desarrollo de los servicios web y la recuperación informacional de mayor calidad. Este recurso, por su capacidad relacional de representar y organizar el conocimiento ha optimizado el trabajo colaborativo y la interdisciplinaridad entre materias a la que se adapta, teniendo en cuenta su índole científica o cultural.
Las ontologías poseen una intrínseca relación con las Humanidades Digitales. Son infraestructuras, que, en su funcionamiento, han sido adoptadas por dicho campo debido a que permiten la representación de la información contenida en una colección de textos digitales.
El uso de las herramientas de extracción automática de información posibilitó el procesamiento terminológico y la comprensión métrica - prosódica del texto analizado. Este estudio disgregó la obra en sus principales componentes y formas de estilo y redacción adoptados. De esta manera, dicho trabajo se empleó como ventaja para obtener los datos descriptivos, utilizados en la confección de la representación ontológica y fundamentalmente en la descripción de las clases pertenecientes al modelo ontológico.
La modelación de la obra poética, siguiendo los pasos estipulados por la metodología ontológica: Simple knowledge-engineering methodology, permitió desarrollar un recurso dinámico que comprende todo el universo literario que se expresa en el texto. La estructura del mismo se encuentra diseñada para facilitar la comunicación entre sus componentes informacionales y su recuperación con calidad.
La ontología de la obra poética “En la Calzada de Jesús del Monte” de Eliseo Diego es una aproximación a este tipo de sistema de organización y representación de la información y el conocimiento por parte del Grupo Académico de Investigación de Humanidades Digitales y Ciencias de la Información de Cuba. Con el objetivo de comprender y acercar una nueva mirada desde las tecnologías de la comunicación y la información a este tipo de literatura más allegada a un espacio tradicional.