SciELO - Scientific Electronic Library Online

 
vol.11 issue2Bi-objective approach based in Reinforcement Learning to Job Shop scheduling author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista Cubana de Ciencias Informáticas

On-line version ISSN 2227-1899

Rev cuba cienc informat vol.11 no.2 La Habana Apr.-June 2017

 

ARTÍCULO DE REVISIÓN

 

Sistemas de recomendación semánticos: Una revisión del Estado del Arte

 

Semantic recommendation systems : A State-of-the-Art Survey

 

 

Eric Bárbaro Utrera Sust1*, Alfredo Javier Simón Cuevas2

1 Universidad de las Ciencias Informáticas. Carretera a San Antonio de los Baños, km 2 ½, Torrens, Boyeros, La Habana, Cuba. CP.:19370. ebutrera@uci.cu
2 Universidad Tecnológica de La Habana José Antonio Echeverría, Cujae. Facultad de Informática. La Habana, Cuba. asimon@ceis.cujae.edu.cu

*Autor para la correspondencia: ebutrera@uci.cu

 

 


RESUMEN

Los sistemas de recomendación surgen como respuesta a la necesidad de contar con una herramienta de personalización de contenidos, utilizando información histórica del usuario para recomendarle elementos que le agraden. Uno de los tipos de sistemas de recomendación que están teniendo una amplia cobertura en la literatura científica en los últimos años son los sistemas de recomendación semánticos. Deficiencias que tienen los sistemas de recomendación tradicionales son resueltas utilizando variantes que proponen estos sistemas. Este artículo brinda una visión general de los sistemas de recomendación semánticos teniendo en cuenta su clasificación, tecnologías de la web semántica que utilizan, funcionamiento, arquitecturas, dominios a los que están enfocados, criterios de evaluación y las ventajas y desventajas que presentan.

Palabras clave: información, sistemas de recomendación semántica, web semántica


ABSTRACT

The recommendation systems arise in response to the need to have a content customization tool, using historical information of the user to recommend elements that please him. One of the types of recommendation systems that are having broad coverage in the scientific literature in recent years are semantic recommendation systems. Deficiencies in traditional recommendation systems are solved using variants proposed by semantic recommendation systems. Deficiencies in traditional referral systems are resolved using variants proposed by these systems. This article provides an overview of semantic recommendation systems taking into account their classification, semantic web technologies that use performance, architectures, domains to which they are focused, evaluation criteria and the advantages and disadvantages that they show.

Key words: information, semantic recommendation systems, semantic web


 

 

INTRODUCCIÓN

El constante desarrollo de las tecnologías ha provocado el crecimiento de la información digital. Cada vez aumenta la necesidad de crear alternativas que permitan la recuperación y organización de toda esa información para ponerla a disposición de los usuarios de forma eficiente. Una de las alternativas que ayudan a los usuarios a encontrar de manera personalizada lo que es relevante dentro de un mundo sobrecargado de información son los Sistemas de Recomendación (Di Noia et al., 2015). Los sistemas de recomendación (SR) recopilan información sobre las preferencias de sus usuarios para un conjunto de elementos (por ejemplo, películas, canciones, libros, bromas, gadgets, aplicaciones, sitios web, destinos de viajes y material de aprendizaje electrónico) (Bobadilla et al., 2013) y hacen uso de herramientas y técnicas de software para proporcionar sugerencias útiles para un usuario (Kantor et al., 2011). Existen diferentes tipos de modelos de recomendación según la bibliografía conocidos también como enfoques tradicionales. Estos son: basados en contenidos, filtrado colaborativo, basados en conocimiento e híbridos (Aggarwal, 2016; Di Noia, 2016; Protasiewicz et al., 2016; Rezaeinia et al., 2016; Shah, 2016; Kantor et al., 2011; Li et al., 2011).

Los modelos basados en contenidos utilizan algoritmos dependientes del dominio y enfatizan más en el análisis de los atributos de los elementos para generar predicciones. Cuando se recomiendan documentos como páginas web, publicaciones y noticias, la técnica de filtrado basado en contenido es la que tiene más éxito. En la técnica de filtrado basado en contenido, la recomendación se basa en los perfiles de usuario y utilizan características extraídas del contenido (Isinkaye et al., 2015; Eckhardt, 2012; Cheng et al., 2008). Los sistemas de recomendación basados en filtrado colaborativo recomiendan a los usuarios elementos basados en las puntuaciones de todos los usuarios en forma colectiva. Los sistemas de filtrado colaborativo funcionan recopilando comentarios de los usuarios en forma de calificaciones de elementos en un dominio dado y explotando similitudes en el comportamiento de calificación entre varios usuarios para determinar cómo recomendar un elemento (Shah, 2016; Su, 2009; Ekstrand, 2011). Los sistemas de recomendación basados en conocimiento modelan el perfil de usuario con el fin de, a través de algoritmos de inferencia, identificar el grado de correlación entre sus preferencias y los productos, servicios o contenidos existentes (Aggarwal, 2016; Carrer-Neto et al., 2012). Por su parte los modelos híbridos emplean técnicas de filtrado colaborativo y basado en contenido con el fin de mejorar las recomendaciones resultantes (Su, 2009) y mejorar el problema del arranque en frío, conocido como uno de los principales problemas en los sistemas de recomendación (Aggarwal, 2016; Bobadilla, 2012; Codina, 2010).

Una de las principales limitaciones de los enfoques tradicionales vistos anteriormente es que ignoran completamente la semántica asociada a los atributos de los elementos porque se basan en representaciones basadas en palabras claves (Di Noia, 2016; Schafer, 2007). Se ha demostrado que la precisión de las recomendaciones se puede mejorar integrando el contenido del sitio Web y la estructura del sitio, en particular extendiéndolas con datos semánticos que caracterizan dicho contenido (Hoxha, 2014). En este sentido se han propuesto diversos enfoques para vincular las tecnologías y recomendaciones semánticas, lo que conduce a Sistemas de Recomendación Semánticos (SRS).

El resto de este artículo está estructurado de la siguiente manera: En la Sección se explicará la metodología utilizada para seleccionar los trabajos significativos en el campo de las recomendaciones semánticas. La Sección tres describe los fundamentos: ¿qué son los SRS?, tipos de SRS, dominios específicos en que se centran, tecnologías que utilizan, SRS integrados en sistemas de recomendación tradicionales, arquitecturas, algoritmos, arranque en frío, medidas de similaridad que utilizan y finalmente ventajas y desventajas. En la Sección cuatro se describen las medidas para evaluar las predicciones de las recomendaciones y la sección de conclusiones resume la investigación realizada y propone nuevas áreas de investigación en el campo de los SRS.

 

METODOLOGÍA COMPUTACIONAL

Se realizó un estudio inicial para determinar los temas y términos más representativos en el campo de los Sistemas de Recomendación. Los métodos de investigación empleados son el analítico-sintético e histórico-lógico. El método analítico-sintético se empleó para examinar los elementos de los modelos de recomendación semántica. El método histórico-lógico se utilizó para determinar las distintas etapas de los modelos descritos y la evolución de estos en cuanto a su novedad.

Se seleccionaron un total de 100 trabajos sobre SRS de revistas como Springer, Revista Ciencias de la Información, Instituto de Ingeniería Eléctrica y Electrónica (IEEE), International Journal of Research, Journal of Computer Science and Technology, Knowledge-Based Systems, International Journal of Electronic Commerce, Journal of Artificial Societies and Social Simulation, Expert Systems with Applications an International Journal. Se revisaron artículos de eventos como Proceedings of the 9th International Conference on Semantic Systems y Very Large Data Bases (VLDB) Conference. Se revisaron trabajos a partir de los más citados según Google Scholar en el campo de los sistemas de recomendación de información sobresaliendo trabajos de autores como Luigi Ceccaroni (citado por 784 personas), Zhenyue Zhang (citado por 7550 personas), Yi Zhang (citado por 2613 personas) y Christopher Meek (citado por 11635 personas).

Sistemas de recomendación semánticos. Fundamentos

En esta sección se presentan aspectos relevantes sobe los SRS como son los tipos de SRS, dominios específicos a los que están orientados, tecnologías que utilizan, como manejan el problema del arranque en frío, arquitecturas, algoritmo, medidas de similaridad en las que se basan y ventajas y desventajas que presentan.

Sistemas de recomendación semánticos (SRS)

Los sistemas de recomendación semánticos son herramientas de software que se basan en la interpretación "semántica" de las necesidades de información del usuario. La idea central detrás de estos sistemas es utilizar el conocimiento ontológico para describir los elementos con el fin de tener una representación profunda y estructurada de su contenido (Ávila et al., 2016; del Castillo et al., 2016; Peis et al. 2008). Los SRS forman parte de los sistemas de recomendación basados en conocimiento, con la diferencia de que los basados en conocimiento se apoyan en el uso de una base de datos de información generada por el mismo sistema o por los usuarios que interactúan con el sistema y los semánticos son aquellos que trabajan con información dotada de significado, como se explicaba anteriormente, haciendo uso de ontologías. Las ontologías definen un vocabulario común para la comunicación más allá de lo que permite una abstracción de ciertos elementos de la simulación (Gruber, 2009). Más adelante se abordará un poco más sobre el trabajo con ontologías principalmente vinculadas a los sistemas de recomendación semánticos. Estos tipos de sistemas han ganado auge en los últimos tiempos y han sido estudiados y trabajados por múltiples autores (Adrian et al., 2007; Peis et al., 2008; Font, 2009; Abbar et al., 2009; Codina et al., 2010; Garay et al., 2012; Nimrod, 2012; Muiño, 2013; Cabrer et al., 2014; Franco et al., 2015; Olivencia et al., 2015; Yang et al., 2015; Wang Z et al., 2015; Wang X et al., 2015).

Tipos de SRS

Los SRS se pueden clasificar en tres tipos según la bibliografía consultada (Nuñez, 2012; Font, 2009; del Castillo et al., 2008; Peis et al., 2008):

  • Sistemas basados en ontologías o esquemas de conceptos: Basan sus recomendaciones en ontologías para representar la información, modelar los perfiles de usuarios y los elementos. Utilizan tecnologías de la web semántica para describir el contenido en la web y consultarlo, dígase Marco para la Descripción de Recursos (RDF) y SPARQL (lenguaje de consulta para RDF) respectivamente.

  • Sistemas adaptables al contexto: Son sistemas que se basan en una serie de factores para determinar en qué situación o contexto se encuentra el usuario y así adaptar las recomendaciones a ese contexto o situación. Los elementos que se tienen en cuenta son el lugar donde está, el factor temporal, nivel de experiencia, dispositivo que se está utilizando en el momento de recibir la recomendación, entre otros elementos que permitan inferir el contexto en que se encuentra el usuario y brindar recomendaciones lo más satisfactorias para el usuario.

  • Sistemas basados en redes de confianza: Estos sistemas se basan en la creación de redes de confianza entre las diferentes partes que componen el sistema. Por otra parte, añaden filtros de información adicionales a los sistemas adaptables al contexto y se enfocan en garantizar la fiabilidad y precisión de las recomendaciones mediante la creación de redes de confianza entre las diferentes partes que componen el sistema. La confianza de los usuarios, además de aportar credibilidad a los resultados de las recomendaciones, implica un aumento de calidad y usabilidad del sistema.

Tecnologías de la web semántica en SRS

  • Uso de ontologías en SRS

Los SRS se apoyan en una base de conocimiento para enriquecer semánticamente sus recomendaciones haciendo uso de ontologías (Mejías et al., 2014). Las ontologías se utilizan para declarar hechos (conocimiento estructural) y para definir cómo se pueden extraer conclusiones (conocimiento de inferencia) utilizando instrumentos de razonamiento disponibles. Formalmente, una ontología es un triple (S, P, O) donde S es un conjunto de conceptos (Sujeto), P un conjunto de relaciones (Predicado), y O un conjunto de objetos individuales (Objetos). Los conceptos formalmente denotan subconjuntos de objetos. Desde una perspectiva de lógica formal, tales subconjuntos son la extensión de los conceptos mismos, mientras que los conceptos definen la representación intencional del correspondiente conjunto de objetos (Farrenkopf et al., 2016). Un ejemplo de su uso se puede ver en el trabajo de (Ávila et al., 2014) donde analizan un algoritmo de inferencia semántica utilizado en un Sistema de Recomendación de Contenidos audiovisuales en el contexto de la televisión digital. En este trabajo se hace uso de ontologías para encontrar conocimiento implícito buscando relaciones entre los recursos semánticos que comparten propiedades en común y posteriormente formar secuencias de recursos que permiten obtener una calificación para el contenido televisivo.

Otros ejemplos de trabajos donde se pone en práctica o se propone el uso de ontologías en SRS son en los de (Adrian et al., 2007; Peis et al., 2008; Font, 2009; Codina et al., 2010; Nimrod, 2012; Muiño, 2013; Cabrer et al., 2014; Franco et al., 2015; Olivencia et al., 2015; Wang X et al., 2015; Albacete, 2016).

En (Adrian et al., 2007) se utilizan las ontologías para calcular la similitud entre las etiquetas y posteriormente devolver un esquema de semejanza que contiene una lista de etiquetas a recomendar. En (Peis et al., 2008) utilizan OWL (Lenguaje de Ontología Web) para desarrollar las ontologías que definen semánticamente los diferentes elementos del modelo. En (Font, 2009) al final de la revisión se termina proponiendo un esquema donde recomiendan el uso de ontologías para representar la relación entre los elementos. En (Codina et al., 2010) presentan un sistema de recomendación semántico que utiliza métodos semánticos para mejorar proceso de personalización. En la arquitectura que exponen utilizan las ontologías de dominio para modelar de una manera más efectiva los intereses del usuario y para aplicar un algoritmo de similaridad que proporciona una medida de la afinidad entre un elemento y un usuario. En (Nimrod, 2012) se hace uso de un repositorio ontológico donde está definido el perfil de los usuarios y los datos de los elementos recomendables. Además, se usan las ontologías para almacenar la relación entre las instancias sobre los patrones de comportamiento de usuarios. En (Muiño, 2013) explican el proceso de desarrollo de una ontología. En este trabajo hacen uso de las ontologías para identificar los términos de un determinado dominio a partir de un glosario de términos. En (Cabrer et al., 2014) hacen uso de las ontologías para representar de forma organizada el conocimiento del dominio de aplicación concreto del sistema, en este caso, la TV. En (Franco et al., 2015) proporcionan un modelo de conocimiento que sea explotable por otras aplicaciones semánticas desarrolladas para ambientes organizacionales. El modelo semántico incorpora varios recursos ontológicos y no ontológicos que han sido transformados en módulos ontológicos independientes (ontologías más pequeñas), mediante los cuales se modelan distintos aspectos de una organización y de las dimensiones contextuales a considerar por un sistema de recomendación semántico sensible al contexto. En (Olivencia et al., 2015) el conocimiento semántico del dominio es representado por una ontología, para categorizar los diferentes puntos, actividades a recomendar y las preferencias de los usuarios. Cada punto turístico está etiquetado con uno o varios conceptos de la ontología. En el trabajo (Wang X et al., 2015) se analiza la semántica de los puntos de interés explotando el contenido generado por el usuario en las redes sociales. Hacen uso de ontologías, para obtener la representación semántica del lugar.

  • Uso de RDF en SRS

El uso de datos en estructura RDF se pone en práctica en los trabajos (Adrian et al., 2007; Peis et al., 2008; Yang et al., 20015). La primera etapa del modelo propuesto en (Adrian et al., 2007) utilizan RDF para representar el contenido de los documentos que procesan. El proceso de transformación del contenido de los documentos a RDF lo hacen utilizando Aperture, marco de trabajo para la extracción de datos y metadatos. En (Peis et al., 2008) utilizan vocabularios basados en rdf para definir documentos y perfiles de usuarios. En (Yang et al., 20015) utilizan los grafos RDF que tiene DBpedia para hacer consultas SPARQL sobre estos y hacer la recomendación de recursos.

  • Procesamiento del lenguaje natural en SRS

El procesamiento del lenguaje natural se tiene en cuenta en (Garay et al., 2012) y en (Muiño, 2013). En (Garay et al., 2012) proponen un método con tres etapas, donde se realiza un pre-procesamiento de los documentos (eliminación de palabras vacías y signos de puntuación). Se aplica el proceso de etiquetado gramatical para la extracción de sustantivos de una serie de blogs. Se extraen los sustantivos para generar una base de relaciones semánticas entre sustantivos y temas asociados de cada post. En (Muiño, 2013) proponen un sistema de recomendación para apoyar la gestión de recursos humanos en lo que concierne a la selección de las mejores ofertas y demandas de movilidad. En este trabajo utilizan OpenNLP, WordNet y Google Spell Checker para dar soporte al proceso de recomendación.

SRS enfocados a dominios

Los sistemas de recomendación se están aplicando actualmente en muchos dominios diferentes. En el análisis de la bibliografía en cuestión se identificaron una serie de dominios a los que estaban dirigidos los SRS. A continuación, se exponen algunos de estos dominios.

  • Turismo

En el trabajo de (Borras et al., 2014) hacen un estudio detallado de varios modelos de recomendación enfocados al turismo. Entre tantos que estudian analizan los sistemas de recomendación semánticos de (Wang, 2011) donde explican que estos autores propusieron una ontología basada en turismo que permite la integración automática y dinámica de información heterogénea sobre viajes en línea. Otros de los sistemas estudiados en (Borras et al., 2014) que utilizan ontologías son los de (Borràs et al., 2011; Moreno et al., 2013; Garcia et al., 2011; Sebastià et al., 2009; Sebastià et al., 2010; Martínez-Santiago et al., 2012; Castillo et al., 2008; Ruotsalo et al., 2013; Alonso et al. 2012; Borràs, et al., 2012; Ceccaroni et al., 2009; Lamsfus et al., 2009). Luego del excelente análisis que hace (Borras et al., 2014) aparecen trabajos en el 2015 como son los de (Olivencia et al., 2015) y (Wang X et al., 2015) enfocados al turismo también. El trabajo de (Olivencia et al., 2015) presentan un modelo de guía turística, que recomienda puntos de interés, teniendo en cuenta factores como preferencias personales y atributos contextuales. El trabajo de (Wang X et al., 2015) se estudia la semántica de puntos de interés mediante la explotación del abundante contenido heterogéneo generado por el usuario de diferentes redes sociales. Exploran las descripciones de texto, las fotos, los patrones de registro de usuario y el contexto del lugar para medir semánticamente la semejanza de la ubicación.

  • Filmes

En (Yang et al., 2015) proponen un sistema de recomendación de recursos. En este trabajo, tratan de desarrollar un esquema de recomendación de recursos utilizando datos enlazados (Linked Open Data en inglés). Dentro de los recursos que recomiendan se encuentran los filmes y lo hacen buscando instancias con respecto a algún tipo de recursos 'dbpedia-owl: Film' en DBPedia. Posteriormente las instancias recuperadas se almacenarán en una base de datos de recursos para su procesamiento posterior. En (Cabrer et al., 2014) presentan un sistema recomendador de contenidos televisivos personalizados, llamado AVATAR, para el que proponen una arquitectura de muti-agente, que combina diferentes estrategias de inferencia de conocimiento. Además, utilizan ontologías para obtener un recomendador de contenidos personalizados basado en razonamiento semántico. Por otra parte, tenemos el trabajo de (Garden et al., 2005), quiénes proponen un sistema de recomendación de películas híbrido haciendo uso de la semántica en su módulo basado en contenido junto con una técnica de filtrado colaborativo. Este hace una propuesta interesante para la "retroalimentación semántica" de los usuarios dentro del motor recomendador.

  • Personas

En (Wang Z et al., 2015), proponen un sistema de recomendación de amigos basado en la semántica para redes sociales. El sistema propuesto mide la similitud de los estilos de vida entre los usuarios y recomienda amigos a los usuarios si sus estilos de vida tienen una alta similitud a partir de sensores en teléfonos inteligentes. En (Swarna et al., 2015) presentan un novedoso sistema de recomendación de amigos basado en la semántica para redes sociales, basado en sus estilos de vida en lugar de gráficos sociales que recomienda amigos a los usuarios. El sistema propuesto descubre estilos de vida de los usuarios, mide la similitud de los estilos de vida entre los usuarios y los que tenga estilos de vida similares los recomienda. El trabajo de (Kulkarni et al., 2016), presenta un sistema de recomendación semántico para redes sociales que permite a los usuarios móviles encontrar amigos dentro de un grupo exacto, siempre y cuando compartan estilos de vida similares. Este sistema se basa en los sensores que brindan los teléfonos inteligentes para extraer la semántica de las preferencias de los usuarios.

  • Etiquetado

El trabajo de (De Gemmis et al., 2008) presenta una estrategia que permite a un recomendador basado en contenido inferir los intereses del usuario aplicando técnicas de aprendizaje automático tanto en las descripciones de elementos "oficiales" proporcionadas por un editor como en las etiquetas que los usuarios adoptan para anotar libremente los elementos relevantes. El contenido estático y las etiquetas son analizados preventivamente por técnicas lingüísticas avanzadas con el fin de captar la semántica de los intereses del usuario a menudo ocultos detrás de las palabras clave. En (Garay et al., 2012) presentan un método no supervisado orientado a la sugerencia de etiquetas para posts de blogs utilizando información semántica de una base de conocimientos que posee todos los post existentes del blog.  En (Symeonidis et al., 2010) proponen un marco unificado para la prestación de recomendaciones en los sistemas de marcado social basado en el análisis semántico ternario (usuarios, elementos y etiquetas). Sus resultados muestran mejoras significativas en términos de efectividad medido a través de la métrica precisión y exhaustividad.

Arquitecturas en SRS

Una de las arquitecturas más utilizadas en el desarrollo de SRS es la multiagentes. Esta arquitectura tiene la capacidad de proporcionar técnicas y aspectos necesarios para tratar adecuadamente el carácter dinámico de los sistemas de recomendación (Font, 2009). En los modelos de recomendación semánticos estudiados el trabajo con arquitecturas distribuidas se pone en práctica en (Adrian et al., 2007; Peis et al., 2008; Font, 2009; Nimrod, 2012; Muiño, 2013; Cabrer et al., 2014; Franco et al., 2015; Olivencia et al., 2015; Yang et al., 2015; Wang X et al., 2015).

En (Adrian et al., 2007) se analiza un enfoque para generar recomendaciones de etiquetas semánticas. En este trabajo utilizan una arquitectura multiagente donde cada componente representa una etapa de procesamiento de la información. Las fases de este modelo son: Normalización, Extracción de tópicos, Generación de similitud y Ejecución de similitud. El servicio propuesto por (Peis et al., 2008) cuenta con tres agentes: uno de interfaz, un segundo de canales y un tercero de tareas, que se distribuyen en una arquitectura jerárquica de cuatro niveles: usuario, interfaz, tarea y recursos. En (Font, 2009) a partir de un estudio del arte sobre los sistemas de recomendación, se propone la utilización de diferentes agentes para la realización del proceso de recomendación. En este trabajo se presentan cuatro agentes: un agente que opera los elementos, un agente de relaciones entre elementos y usuarios, un agente de perfiles y un agente usuario. En (Nimrod, 2012) se presenta un sistema de recomendación semántico consciente del contexto para ambientes organizacionales. En este trabajo el autor propone una arquitectura distribuida compuesta por un agente para poblar ontologías, un agente para recolectar el contexto de los documentos, un agente para identificar la localización de los usuarios, un agente para observar el comportamiento de los usuarios y un agente adaptable al usuario. Además, presenta un motor de inferencia que está integrado por un módulo de pre-filtrado de elementos, un módulo de extracción de instancias asociadas a una organización, un módulo generador de recomendaciones y un módulo para la actualización de conjuntos de elementos pre-filtrados. En (Muiño, 2013) se basan en seguir el enfoque de los sistemas de matchmaking semánticos. Proponen una arquitectura compuesta por cuatro módulos: módulo de ontologías, módulo preprocesador, módulo procesador del match y un último módulo de interfaz gráfica. En 2014 los autores (Cabrer et al., 2014) presentan un sistema de recomendación de contenidos de TV personalizados, llamado AVATAR, y proponen una arquitectura multiagente, que combina diferentes estrategias de conocimiento de inferencia. Lo agentes propuestos son: un agente de recomendación, un agente de retroalimentación, un agente de contenido y un agente local. Este último se encarga de manejar las acciones de los usuarios con el sistema de recomendación. En (Franco et al., 2015) se propone una arquitectura multiagente para desarrollar un sistema de recomendación semántico sensible al contexto. En este proponen un módulo de localización, un módulo de inferencia y un módulo de identificación de comportamiento de usuarios. En (Olivencia et al., 2015) proponen una arquitectura donde diferentes subsistemas hacen una determinada función para conseguir finalmente la recomendación. Los subsistemas de la arquitectura son: un sistema de almacenamiento y gestor de contenidos donde se almacena toda la información sobre los puntos de interés del usuario, un sistema de procesamiento avanzado para mostrar información a través de geolocalización, un gestor de perfiles de usuarios para almacenar y modificar toda la información del turista y un sistema de recomendación compuesto por diferentes módulos de recomendación que generan listas de recomendaciones. En (Yang et al., 2015) proponen una arquitectura compuesta por un módulo encargado de adquirir los recursos de la DBpedia, un segundo módulo que se encarga de clasificar los atributos de los recursos, un tercer módulo encargado de calcular la semejanza entre los recursos y un último módulo de recomendación. En (Wang X et al., 2015) se presenta Friendbook, un novedoso sistema de recomendación de amigos basados en la semántica de las redes sociales, que recomienda amigos a los usuarios en función de sus estilos de vida. Este sistema propone una arquitectura distribuida compuesta por: un componente de colección de datos, un componente para el control de retroalimentación, un componente que clasifica el impacto de las recomendaciones sobre el usuario y un componente que analiza el estilo de vida de los usuarios.

Arranque en frío en SRS

Los sistemas de recomendación presentan problemas que afectan la calidad de las recomendaciones de los usuarios. Uno de los problemas que más incide en las recomendaciones de los usuarios, específicamente en los sistemas basados en filtrado colaborativo es el arranque en frío (cold-start en inglés). El arranque en frío aparece en la etapa inicial de la utilización del sistema de recomendación, cuando la mayoría de los elementos aún no han sido calificados y, por lo tanto, no son utilizados para los cálculos de similitud (Lika et al., 2014). En un SRS este problema no afecta, debido a que sus recomendaciones no dependen de las valoraciones de los usuarios, están basadas en el conocimiento del dominio. Generalmente en este tipo de sistemas se emplean métodos de inferencia basados en el dominio en combinación con otros métodos de retroalimentación de relevancia para rellenar rápidamente el perfil de usuario desde un inicio (Codina et al., 2010).

Evaluación

El campo de los sistemas de recomendación de información requiere de métricas para medir la calidad de las recomendaciones. En los SRS las métricas para evaluar la calidad son las mismas utilizadas por los sistemas de recomendación tradicionales. A continuación, se presenta una selección representativa de las medidas de calidad de evaluación más utilizadas en la bibliografía (Gunawardana et al., 2009; Bobadilla et al., 2013; Aggarwal, 2016).

Para medir la calidad de las predicciones se utiliza:

  • Error absoluto medio = fo01

  • Error de la raíz cuadrada de la media = fo02

Donde U es el conjunto de usuarios del sistema de recomendación e i es el conjunto de elementos, rui es el valor de la calificación real del usuario u sobre el elemento iy *rui es el valor predicho por el sistema para esa calificación. Cuanto menores sean estos valores, mayor será la precisión de las predicciones.

La cobertura mide el porcentaje de elementos que un sistema es capaz de recomendar respecto al conjunto total de elementos en la base de datos.

  • Cobertura = fo14

Donde Cu es la lista de recomendaciones brindadas en las primeras posiciones y Du el total de elementos del sistema. Una baja cobertura indica que el algoritmo puede acceder y recomendar solo un pequeño número de objetos distintos (normalmente los más populares), los cuales a menudo resultan en recomendaciones poco diversas. Por lo contrario, los algoritmos con una alta cobertura son más susceptibles de proporcionar recomendaciones diversas.

Para medir la calidad de la lista de recomendación se utiliza:

fo04

Donde TD es el total de elementos recomendados, R(TD) indica el número de elementos relevantes entre los TD primeros de la lista de recomendación y TR es el número total de elementos relevantes para un usuario u. Para medir la calidad se pueden utilizar los dos o uno solo, solo se debe tener en cuenta que el índice de exhaustividad proporciona una medida del sistema para recomendar documentos que puedan ser relevantes para el usuario y el índice de precisión muestra la habilidad de sistema para evitar el ruido.

Ventajas de utilizar SRS

  • Disponibilidad de una gran cantidad de conocimiento multidominio y ontológico libremente disponible para alimentar el sistema.

  • Normas y tecnologías de la Web Semántica para recuperar los datos requeridos y por lo tanto no hay necesidad de tareas de análisis de contenido para obtener una representación estructurada del contenido de los elementos.

  • La naturaleza ontológica y relacional de los datos permite al sistema analizar descripciones de elementos a nivel semántico (Di Noia et al., 2015).

  • Mejoran los algoritmos de filtrado al hacer uso de métodos de similitud semántica basados en la estructura jerárquica de las ontologías para refinar el cálculo del puntaje de coincidencia de elemento-usuario (Codina et al., 2010).

Desventajas de utilizar SRS

  • Los SRS se centran en generar recomendaciones en un solo dominio, es decir, un sistema con un conjunto distinto de usuarios y objetos (Hoxha, 2014).

  • Normalmente, las ontologías utilizadas por los sistemas de recomendación están diseñadas ad hoc para una aplicación específica y construidas manualmente (Borras et al., 2014; Lika et al., 2014).

 

CONCLUSIONES

Durante el análisis de la bibliografía especializada referente a los sistemas de recomendación semánticos se pudo llegar a las siguientes conclusiones:

  • Existen artículos que reflejan el estado del arte de los Sistemas de Recomendación (Mahboob et al., 2015; Sridevi et al., 2016; Beel et al., 2013; Bobadilla et al., 2013; Lu et al., 2015) pero ninguno se centra en hacer una revisión de los SRS y en tener en cuenta todas las características abordadas en esta investigación.

  • La mayoría de los sistemas de recomendación semánticos utilizan la arquitectura distribuida basada en agentes por la capacidad que tiene de tratar adecuadamente el carácter dinámico de los sistemas de recomendación dividiendo el problema en varios subproblemas.

  • Los sistemas de recomendación semánticos analizados utilizan ontologías para representar la relación semántica entre los términos del dominio que representan. En la mayoría de los casos estas ontologías se enfocan a un dominio, imposibilitando su uso por otros sistemas de recomendación que administran dominios diferentes.

  • Ninguno de los sistemas revisados en esta investigación presentan una solución para manejar diferentes dominios. Se enfocan en determinados dominios como el turismo, la televisión, la recomendación de personas, entre otros. El que más se acerca es el de (Codina et al., 2010), pero está enfocado a la web semántica, no a la web actual.

  • Una gran parte de los sistemas de recomendación semánticos están orientados al campo del turismo, especialmente para recomendar lugares a los usuarios.

  • Un solo trabajo hasta donde ha llegado esta investigación es único en su tipo y es el de (Wang X. et al., 2015) donde se recomienda información a partir de fotos de lugares en los que haya estado el usuario.

  • El trabajo más completo en cuanto arquitectura y funcionalidades es el de (Nimrod, 2012). Tiene en cuenta varios medios de información para hacer recomendaciones.

  • Muy pocos tratan los datos en estructuras RDF y hacen uso de SPARQL, lo que evidencia que no se ha trabajado mucho en el área de los sistemas de recomendación semánticos haciendo uso de estas tecnologías de la web semántica.

  • Pocos manejan el procesamiento de consultas lo que evidencia que un sistema de recomendación no trabaja con las consultas de los usuarios, se enfoca generalmente en las preferencias de los usuarios y en la retroalimentación a partir de las recomendaciones que se hacen.

  • En este sentido el procesamiento del lenguaje natural es enfocado al procesamiento de documentos para identificar las relaciones semánticas entre los términos, en ninguno es utilizado para procesar las consultas de los usuarios.

  • Aunque se consideran los Sistemas de Recomendación Semánticos como un tipo diferente de Sistemas de Recomendación, en varios Sistemas de Recomendación se considera el tratamiento de la semántica, por ejemplo, en los basados en contenido y en conocimiento.

 

REFERENCIAS

AGGARWAL, CHARU C. Recommender Systems: The Textbook. Springer, 2016.

ÁVILA, J., K. PALACIO-BAUS, M., et al. Sistema de recomendación de contenidos audiovisuales: Algoritmo de inferencia semántica. Maskana 65, 2016.

ALBACETE, G., E. An Ontology for Human-Like Interaction Systems. Tesis doctoral. Universidad Carlos III de Madrid, Madrid, 2016.

ADRIAN, B., SAUERMANN, L., et al. Contag: A semantic tag recommendation system. Proceedings of I-Semantics, 2007, 7, pp.297-304.

ABBAR, S., BOUZEGHOUB, M., et al. Context-aware recommender systems: A service-oriented approach. In VLDB PersDB workshop, 2009. (pp. 1-6).

BOBADILLA, J., ORTEGA F., et al. Recommender systems survey. Knowledge-Based Systems, 2013, 46: 109-132.

BOBADILLA, J., ORTEGA, F., et al. A collaborative filtering approach to mitigate the new user cold start problem. Knowledge-Based Systems, 2012, 26: 225–238.

BORRAS, J., MORENO A., et al. Intelligent tourism recommender systems: A survey. Expert Systems with Applications, 2014, 41: 7370-7389.

BARBEAU, M., and  KRANAKIS E. Principles of ad-hoc networking. John Wiley & Sons, 2007.

BEEL, J., GENZMEHR M., et al. A comparative analysis of offline and online evaluations and discussion of research paper recommender system evaluation. In Proceedings of the international workshop on reproducibility and replication in recommender systems evaluation, pp. 7-14. ACM, 2013.

CODINA, V. AND CECCARONI L. A recommendation system for the semantic web. Springer Berlin Heidelberg, 2010 pp. 45-52.

CHEN, Y.L. AND CHENG, L.C. A novel collaborative filtering approach for recommending ranked items. Expert Systems with Applications, 2008, Vol. 34, pp. 2396-2405.

CABRER, M.R., FERNÁNDEZ, Y.B., et al. AVATAR: Un sistema de recomendación personalizada de contenidos televisivos basado en información semántica. 2014.

CARRER-NETO, W., HERNÁNDEZ M. L., et al. Social knowledge-based recommender system. Application to the movies domain. Expert Systems with applications, 2012, 39: 10990-11000.

DI NOIA, T., AND VITO, C. O. Recommender Systems and Linked Open Data. Springer International Publishing, 2015 pp. 88-113.

DI NOIA, T. Recommender Systems Meet Linked Open Data. Springer International Publishing, 2016, pp. 620-623.

DI NOIA, T., DI SCIASCIO, E., et al. A system for Principled Matchmaking in an Electronic Marketplace. International Journal of Electronic Commerce, 2004.

Del CASTILLO; J. A. DELGADO-LÓPEZ, et al. Semantic recommender systems. analysis of the state of the topic. [En línea], 2016. [ 5 de septiembre de 2016]. Disponible en [http://www.hipertext.net. ].

EKSTRAND, M.D., RIEDL, J.T., et al. Collaborative filtering recommender systems, Found. Trends Human–Comput. 2011, Vol. 4, pp. 81-173.

ECKHARDT, A. Similarity of users (content-based) preference models for Collaborative filtering in few ratings scenario. Expert Systems with Applications, 2012, Vol. 39, pp. 11511–11516.

FARRENKOPF, T., GUCKERT, M., et al. Ontology Based Business Simulations. Journal of Artificial Societies and Social Simulation, 2016, 19.

FRANCO, N.G., SÁNCHEZ, H.O.A. et al. Arquitectura de un sistema de recomendación semántico sensible al contexto para entornos tipo campus. Ciencias de la Información, 2015, 46(1), pp.11-17.

FONT, S. M. Sistemas de recomendación para webs de información sobre la salud. Tesis de Máster y PhD in Computing. Universidad Politécnica de Catalunya, Barcelona, 2009.

GUNAWARDANA, A., AND GUY S. A survey of accuracy evaluation metrics of recommendation tasks. Journal of Machine Learning Research, 2009, 10: 2935-2962.

GRUBER, T. Ontology. Encyclopedia of database systems, 2009: 1963-1965.

GARAY, A.B. AND CONDORI, R.L. Método No Supervisado para la Sugerencia de Tags Utilizando Información Semántica Basada en Conocimiento.2012

GARDEN, MATTHEW, AND GREGORY D. Semantic feedback for hybrid recommendations in recommendz. IEEE, 2005 pp. 754-759.

HOXHA, J. Cross-domain recommendations based on semantically-enhanced User Web Behavior. PhD diss., Karlsruhe, Karlsruher Institut für Technologie (KIT), Diss., 2014.

ISINKAYE, F. O., Y. O. FOLAJIMI, et al. Recommendation systems: Principles, methods and evaluation. Egyptian Informatics Journal, 2015, 16: 261-273.

KANTOR, P.B., L. ROKACH, et al. Recommender systems handbook. Springer, 2011, 842 pp.

LYONS, J. Linguistic semantics: An introduction. Cambridge University Press, 1995.

LI, L., DING-DING W., et al. Personalized news recommendation: a review and an experimental investigation. Journal of Computer Science and Technology, 2011, 26: 754-766.

LU, J., DIANSHUANG, W., et al. Recommender system application developments: a survey. Decision Support Systems 74 (2015): 12-32.

MUIÑO, M. C. Sistema de recomendación semántico para la movilidad en el entorno África Build Portal. Tesis de grado, Universidad Politécnica de Madrid, Madrid, 2013.

MAHBOOB, T., FATIMA A., et al. A survey and analysis on recommendation system algorithms. International Journal of Computer Science Issues (IJCSI) 12, no. 3 (2015): 162.

MEJÍA, M. E., SAQUICELA, V., et al. Extracción de preferencias televisivas desde los perfiles de redes sociales. Revista Politécnica, 2014, 34.

NIMROD G. F. Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organizacionales y de Usuario en Entornos de Cómputo Móvil. TESIS DE MAESTRÍA EN CIENCIAS, Centro Nacional de Investigación y Desarrollo Tecnológico Departamento de Ciencias Computacionales, México, 2012.

NÚÑEZ, V. E. Sistemas de recomendación de contenidos para libros inteligentes. 2012.

OLIVENCIA, J.L.L., PLAZA, A.G., et al. RAMCAT: Modelo para generar recomendaciones en un sistema de realidad aumentada contextual basándose en las preferencias del turista. Revista de Turismo y Patrimonio Cultural, 2015, 13(3), pp.649-668.

PROTASIEWICZ, J., WITOLD P., et al. A recommender system of reviewers and experts in reviewing problems. Knowledge-Based Systems 2016.

PEIS, E., DEL CASTILLO, J. M. M., et al. Semantic Recommender Systems. Analysis of the state of the topic. [En línea], Hipertext.net, 2008, [Consultado el: 3 de noviembre de 2016]. Disponible en: [https://www.upf.edu/hipertextnet/en/numero-6/recomendacion.html].

REZAEINIA, S. M., AND ROUHOLLAH, R. Recommender system based on customer segmentation (RSCS). Kybernetes, 2016, 45.

SWARNA, V., AND G. MINNI. Friend book: A Scalable and Efficient Friend Recommendation Using Integrated Feedback Approach. International Journal of Research, 2015, 2: 277-281.

SCHAFER, J. BEN, FRANKOWSKI, D., et al. Collaborative filtering recommender systems. Springer Berlin Heidelberg, 2007: pp. 291-324.

SRIDEVI, M., R. RAJESHWARA RAO, et al. A Survey on Recommender System. International Journal of Computer Science and Information Security 14, no. 5 (2016): 265.

SU, X., AND TAGHI M. K. A survey of collaborative filtering techniques. Advances in artificial intelligence 2009: 4.

SHAH, L., HETAL G., AND PREM B. Survey on Recommendation System. System, 2016, 137.

WANG, Z., LIAO, J., et al. Friendbook: a semantic-based friend recommendation system for social networks. IEEE Transactions on Mobile Computing, 2015, 14(3), pp.538-551.

WANG, X., ZHAO, Y.L., et al. Semantic-based location recommendation with multimodal venue semantics. IEEE Transactions on Multimedia, 2015, 17(3), pp.409-419.

WANG, W., ZENG, G., et al. Bayesian intelligent semantic mashup for tourism. Concurrency and Computation: Practice and Experience, 2011, 23, 850–862.

YANG, H.C. AND HSU, C.C. Semantic Recommendation Using Linked Open Data. In Proceedings of the ASE BigData & SocialInformatics, 2015 (p. 8). ACM.

 

 

Recibido: 14/12/2016
Aceptado: 10/04/2017

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons