<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992018000100013</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Modelo computacional para el desarrollo de sistemas de recuperación de información]]></article-title>
<article-title xml:lang="en"><![CDATA[Computational model to develop information retrieval systems]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rodríguez Leyva]]></surname>
<given-names><![CDATA[Paúl]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Delgado Mesa]]></surname>
<given-names><![CDATA[Yennifer]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Viltres Sala]]></surname>
<given-names><![CDATA[Hubert]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Estrada Sentí]]></surname>
<given-names><![CDATA[Vivian]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Febles]]></surname>
<given-names><![CDATA[Juan Pedro]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Centro CIDI ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Centro CESOL ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Departamento Metodológico de Postgrado ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>03</month>
<year>2018</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>03</month>
<year>2018</year>
</pub-date>
<volume>12</volume>
<numero>1</numero>
<fpage>173</fpage>
<lpage>188</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992018000100013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992018000100013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992018000100013&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El campo de la recuperación de información, desde su surgimiento en el año 1950, ha aportado herramientas que permiten a los usuarios encontrar respuestas a sus necesidades e interrogantes. A pesar de confirmar en los estudios bibliográficos la existencia de varios modelos de recuperación de información, existen vacíos teóricos relacionados con aspectos como: la definición de arquitecturas escalables para el soporte de todos los componentes de hardware de un sistema de recuperación de información, fundamentación profunda de algoritmos para el cálculo de relevancia, integración de componentes de apoyo a la toma de decisiones con la estructura básica de un sistema de recuperación de información y los roles necesarios para ejecutar el desarrollo y soporte de las tareas fundamentales del proceso de recuperación de información. La presente investigación propone un modelo que integra las variables antes mencionadas y brinda mecanismos para mejorar el proceso de recuperación de información.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The field of information retrieval, since its inception in 1950, has provided tools that allow users to find answers to their needs and questions. In spite of confirming in the bibliographic studies the existence of several models of information retrieval, there are theoretical gaps related to aspects such as: the definition of scalable architectures for the support of all the hardware components of an information retrieval system, deep foundations of algorithms for the calculation of relevance, integration of components to support decision making with the basic structure of an information retrieval system and the necessary roles to execute the development and support of the fundamental tasks of the information retrieval process. The present research proposes a model that integrates the aforementioned variables and provides mechanisms to improve the process of information retrieval.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[buscadores]]></kwd>
<kwd lng="es"><![CDATA[modelo computacional]]></kwd>
<kwd lng="es"><![CDATA[recuperación de información]]></kwd>
<kwd lng="es"><![CDATA[relevancia]]></kwd>
<kwd lng="en"><![CDATA[computational model]]></kwd>
<kwd lng="en"><![CDATA[information retrieval]]></kwd>
<kwd lng="en"><![CDATA[relevance]]></kwd>
<kwd lng="en"><![CDATA[search engine]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Modelo  computacional para el desarrollo de sistemas de recuperaci&oacute;n de informaci&oacute;n</font></strong></font></p>     <p>&nbsp;</p>     <p><strong><font size="3"><em><font face="Verdana, Arial, Helvetica, sans-serif">Computational  model to develop information retrieval systems</font></em></font></strong></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Pa&uacute;l Rodr&iacute;guez Leyva<strong><sup>1*</sup></strong>,Yennifer Delgado Mesa</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font><font size="2"><font face="Verdana, Arial, Helvetica, sans-serif"><strong>, Hubert Viltres Sala<sup>1</sup></strong></font></font><font face="Verdana, Arial, Helvetica, sans-serif"><strong>, Vivian Estrada Sent&iacute;<sup>3</sup></strong></font></font><font size="2"><font face="Verdana, Arial, Helvetica, sans-serif"><strong>, Juan Pedro Febles<sup>3</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Centro CIDI, Universidad de las Ciencias Inform&aacute;ticas,  Carretera San Antonio de los Ba&ntilde;os Km 2 &frac12;, Boyeros, La Habana, Cuba. {<a href="mailto:pleyva,%20hviltres%7d@uci.cu">pleyva,  hviltres}@uci.cu</a></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br>     <sup>2</sup>Centro CESOL, Universidad de  las Ciencias Inform&aacute;ticas, Carretera San Antonio de los Ba&ntilde;os Km 2 &frac12;, Boyeros, La Habana, Cuba. <a href="mailto:ydmesa@uci.cu">ydmesa@uci.cu</a>    ]]></body>
<body><![CDATA[<br>       <sup>3</sup>Departamento Metodol&oacute;gico de  Postgrado, Universidad de las Ciencias Inform&aacute;ticas, La Habana, Cuba. {vivian, febles}@uci.cu           <br> </font>    <br> </p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:pleyva@uci.cu">pleyva@uci.cu</a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El campo de la recuperaci&oacute;n de  informaci&oacute;n, desde su surgimiento en el a&ntilde;o 1950, ha aportado  herramientas que permiten a los usuarios encontrar respuestas a sus necesidades  e interrogantes. A pesar de confirmar en los estudios bibliogr&aacute;ficos la  existencia de varios modelos de recuperaci&oacute;n de informaci&oacute;n, existen vac&iacute;os  te&oacute;ricos relacionados con aspectos como: la definici&oacute;n de arquitecturas  escalables para el soporte de todos los componentes de hardware de un sistema  de recuperaci&oacute;n de informaci&oacute;n, fundamentaci&oacute;n profunda de algoritmos para el  c&aacute;lculo de relevancia, integraci&oacute;n de componentes de apoyo a la toma de  decisiones con la estructura b&aacute;sica de un sistema de recuperaci&oacute;n de  informaci&oacute;n y los roles necesarios para ejecutar el desarrollo y soporte de las  tareas fundamentales del proceso de recuperaci&oacute;n de informaci&oacute;n. La presente  investigaci&oacute;n propone un modelo que integra las variables antes mencionadas y  brinda mecanismos para mejorar el proceso de recuperaci&oacute;n de informaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">buscadores, modelo  computacional, recuperaci&oacute;n de informaci&oacute;n, relevancia</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The field  of information retrieval, since its inception in 1950, has provided tools that  allow users to find answers to their needs and questions. In spite of  confirming in the bibliographic studies the existence of several models of information  retrieval, there are theoretical gaps related to aspects such as: the  definition of scalable architectures for the support of all the hardware  components of an information retrieval system, deep foundations of algorithms  for the calculation of relevance, integration of components to support decision  making with the basic structure of an information retrieval system and the  necessary roles to execute the development and support of the fundamental tasks  of the information retrieval process. The present research proposes a model  that integrates the aforementioned variables and provides mechanisms to improve  the process of information retrieval.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>computational  model, information retrieval, relevance, search engine.</font></p> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La recuperaci&oacute;n de informaci&oacute;n  (RI) se ocupa de encontrar material (normalmente documentos) de una naturaleza  no estructurada (normalmente texto) que se encuentra en grandes colecciones  (normalmente almacenada de forma digital) y satisface una necesidad de informaci&oacute;n  (Diego, 2009; R&iacute;ssola et al., 2009). Los sistemas de recuperaci&oacute;n de  informaci&oacute;n, en lo adelante SRI, son herramientas estructuradas por componentes  que emplean diferentes algoritmos y m&eacute;todos para satisfacer la necesidad de  informaci&oacute;n planteada por un usuario en una consulta en lenguaje natural  especificada a trav&eacute;s de un conjunto de palabras claves (James et al., 2005;  Bl&aacute;zquez, 2013; Lafferty et al., 2017). Estos sistemas fundamentan su  funcionamiento en modelos de RI destinados a establecer mecanismos para  responder las necesidades de b&uacute;squeda de los usuarios (Maldonado et al., 2017).  El t&eacute;rmino modelo tiene un significado bien conocido dentro del campo de la RI. Este significado no  es m&aacute;s que una adaptaci&oacute;n directa de su significado general (esquema te&oacute;rico de  un sistema o de una realidad compleja que se elabora para facilitar su  comprensi&oacute;n y el estudio de su comportamiento) a este dominio concreto. En el  campo de la RI, de  forma simplificada, podemos considerar un modelo como un m&eacute;todo para representar  tanto documentos como consultas en sistemas de recuperaci&oacute;n de la informaci&oacute;n,  y comparar la similitud de esas representaciones. Para ello, los modelos de  recuperaci&oacute;n tienen que proporcionar de manera impl&iacute;cita o expl&iacute;cita una  definici&oacute;n de relevancia. Adem&aacute;s, pueden describir el proceso computacional, el  proceso humano y las variables que intervienen en el proceso global (Diego,  2009). Empresas como Google no brindan informaci&oacute;n concreta de que modelos  utilizan para desarrollar los componentes de sus buscadores (Fransson, 2010).  Adem&aacute;s, el c&aacute;lculo de la relevancia de sus documentos responde a pol&iacute;ticas  comerciales y gubernamentales, por lo que resulta dif&iacute;cil desarrollar sistemas  tan complejos como los buscadores sin poseer un modelo computacional que apoye  el proceso de desarrollo de los mismos. El objetivo de esta investigaci&oacute;n es la  fundamentaci&oacute;n de un modelo computacional para el procesamiento de documentos y  apoyo a la toma de decisiones en sistemas de recuperaci&oacute;n de informaci&oacute;n que  sirve para el dise&ntilde;o, desarrollo y despliegue de buscadores a nivel nacional e  internacional.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0115118.jpg" alt="f01" width="531" height="329"><a name="f01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El modelo  computacional propuesto se basa principalmente en 4 principios: escalabilidad,  interoperabilidad, estandarizaci&oacute;n y actualizaci&oacute;n. Su estructura est&aacute;  compuesta por 5 componentes (<a href="#f01">Fig. 1</a>). El rastreo e indexaci&oacute;n peri&oacute;dica de la  web permite a los SRI convertirse en una fuente de constante almacenamiento de  informaci&oacute;n. Los datos almacenados dependen espec&iacute;ficamente del funcionamiento  interno del buscador y de la estructura real que posee el contenido alojado en  la web. Generalmente de cada documento indexado se almacenan metadatos como:  url, resumen del contenido, enlaces salientes, palabras claves, el lenguaje en  el que est&aacute; estructurado el documento y tipo mime. El objetivo principal de  este componente es rastrear la web y almacenar toda la informaci&oacute;n encontrada;  para lograrlo se apoya en dos mecanismos fundamentales: mecanismo de rastreo y  el mecanismo de indexaci&oacute;n. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Mecanismo de rastreo:</strong> basa su  funcionamiento en un conjunto de rastreadores web que inician un proceso de  recolecci&oacute;n, partiendo de un semillero de enlaces de sitios web que debe contener  el mayor n&uacute;mero de enlaces posible para lograr un rastreo exhaustivo. Para su  correcto funcionamiento se dise&ntilde;a una arquitectura distribuida, (<a href="#f02">Fig. 2</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este dise&ntilde;o propone organizar los servidores teniendo  en cuenta las categor&iacute;as de informaci&oacute;n de la web que se va a rastrear (un  servidor por categor&iacute;a) y su tama&ntilde;o, valorando la capacidad de procesamiento y  almacenamiento del hardware que se posee. Si la web es muy grande, un n&uacute;mero  peque&ntilde;o de rastreadores no podr&iacute;a cumplir con el objetivo propuesto. La  periodicidad del proceso de rastreo depende del grado de actualizaci&oacute;n de los  sitios definidos en los semilleros de cada uno de los rastreadores; as&iacute; los  usuarios tendr&iacute;an disponible la informaci&oacute;n en un per&iacute;odo corto de tiempo  despu&eacute;s de su publicaci&oacute;n en la web. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0215118.jpg" alt="f02" width="226" height="316"><a name="f02"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Mecanismo de indexaci&oacute;n:</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"> es el encargado principalmente de la estructuraci&oacute;n y  almacenamiento de los documentos. Adem&aacute;s, aplica el modelo de RI para el  c&aacute;lculo de la relevancia de los documentos relativa a las necesidades de  b&uacute;squeda de los usuarios. Para su despliegue se propone una arquitectura  distribuida, (<a href="#f03">Fig. 3</a>).</font></font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0315118.jpg" alt="f03" width="428" height="319"><a name="f03"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Antes de proceder al almacenamiento de los documentos rastreados se aplica  un proceso de estandarizaci&oacute;n que permite definir una estructura correcta para  cada uno de los documentos y evita almacenar documentos que no aporten  informaci&oacute;n &uacute;til, para lo que se definen los siguientes metadatos como  imprescindibles:</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Tipo Mime:</strong> formato del documento (jpg, doc, html, entre otros)    <br>     <strong>Resumen:</strong> un sumario del contenido del recurso    <br>     <strong>Fecha:</strong> la fecha de elaboraci&oacute;n del registro    <br>     <strong>Url:</strong> Se refiere a la direcci&oacute;n electr&oacute;nica de origen a la que est&aacute; adscrito el  material    ]]></body>
<body><![CDATA[<br>     <strong>T&iacute;tulo:</strong> se refiere al t&iacute;tulo que lleva por nombre el documento    <br>     <strong>Sitio:</strong> el host del que procede el documento    <br>     <strong>Contenido:</strong> texto completo del documento    <br>     <strong>Enlaces salientes:</strong> enlaces a sitios externos    <br>   <strong>Lenguaje:</strong> idioma base del documento</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si los documentos que se van a indexar carecen de alguno de los metadatos  definidos anteriormente no se almacenan, para evitar brindar informaci&oacute;n  incompleta a los usuarios del sistema. El modelo de RI que se propone es el  vectorial. Salton fue el primero en proponer los SRI basados en las estructuras  de espacio vectorial a finales de los 60 dentro del marco del proyecto SMART.  Partiendo de que se pueden representar los documentos como vectores de  t&eacute;rminos, los documentos podr&aacute;n situarse en un espacio vectorial de <strong>m</strong> dimensiones, con tantas dimensiones  como componentes tenga el vector (Mabel, 2013). La idea fundamental en la que  se basa el modelo vectorial es considerar que tanto los t&eacute;rminos claves con  respecto a un documento como las consultas, se pueden representar a trav&eacute;s de  un vector en un espacio de alta dimensionalidad. Por tanto, para evaluar la  similitud entre un documento y una consulta; simplemente hay que realizar una  comparaci&oacute;n de los vectores que los representan (Sequera, 2010).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el c&aacute;lculo de la relevancia de los documentos con  respecto a las consultas se dise&ntilde;a un algoritmo, (<a href="#f04">Fig. 4</a>), que permite a&ntilde;adir a  las ecuaciones cl&aacute;sicas de c&aacute;lculo de similitud (Coseno, Jaccard y Dice) una  variable (SC) que relaciona las preferencias de b&uacute;squedas de los usuarios o  perfil de b&uacute;squeda (PBU) con las categor&iacute;as de los documentos almacenados  (CDoc) (Baquerizo et al., 2017). Para obtener el PBU y as&iacute; establecer cu&aacute;l o  cu&aacute;les categor&iacute;as son las m&aacute;s buscadas por los usuarios y adem&aacute;s obtener las  categor&iacute;as de los documentos almacenados CDoc, se propone la utilizaci&oacute;n de  t&eacute;cnicas de miner&iacute;a web como base del funcionamiento del componente de  procesamiento de informaci&oacute;n. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0415118.jpg" alt="f04" width="474" height="267"><a name="f04"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La miner&iacute;a web (MW) se refiere esencialmente al descubrimiento y an&aacute;lisis  de informaci&oacute;n de los usuarios en la web, con el objetivo de descubrir patrones  de comportamiento (V&aacute;squez et al., 2016). Definidas cada una de las categor&iacute;as  en las que se basar&aacute; el proceso de categorizaci&oacute;n se debe proceder a asignar un  valor num&eacute;rico a cada una de ellas. Despu&eacute;s de ser definidas las preferencias  de b&uacute;squeda del usuario como resultado de la categorizaci&oacute;n de cada una de las  consultas introducidas anteriormente, estas se ordenan teniendo en cuenta el  porcentaje de predominio (P) de las categor&iacute;as m&aacute;s consultadas. Si existe una  sola categor&iacute;a predominante, el PBU ser&iacute;a igual al valor num&eacute;rico de esta  categor&iacute;a. En caso de que m&aacute;s de una categor&iacute;a sea predominante y posean el  mismo valor de P, el PBU ser&iacute;a una lista con los valores de estas categor&iacute;as.  Con el PBU definido y los documentos categorizados, se procede a comparar los  valores num&eacute;ricos de la o las categor&iacute;as predominantes con la categor&iacute;a de cada  uno de los documentos. En caso de coincidir dichos valores, la variable SC  adquiere el valor de P, garantizando que el valor de SC sea mayor cuando el  documento pertenezca al mismo grupo de la o las categor&iacute;as definidas en su PBU;  de lo contrario el valor de SC es 0 significando que la categor&iacute;a del documento  no es af&iacute;n al PBU</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una vez calculado el valor de SC se suma dicha variable al resultado de la  ecuaci&oacute;n de similitud (Coseno, Jaccard o Dice) utilizada en el modelo vectorial  aplicado, el valor resultante ser&iacute;a la relevancia del documento con respecto a  la consulta introducida por el usuario. El umbral de similitud calculado  inicialmente oscila desde 0 hasta 1, siendo los documentos m&aacute;s relevantes los  m&aacute;s cercanos a 1. Al a&ntilde;adirse la variable SC y sumar su valor a la similitud  inicial, el umbral de similitud aumenta de 0 a 2, siendo los documentos m&aacute;s relevantes los  cercanos a 2. De esta forma se garantiza brindar a los usuarios resultados m&aacute;s  precisos y mejor relacionados con sus preferencias de b&uacute;squedas (Baquerizo et  al., 2017).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Componente de  procesamiento de informaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este componente se ejecuta todo el procesamiento  necesario para la categorizaci&oacute;n de cada uno de los documentos indexados y la  asignaci&oacute;n del perfil de b&uacute;squeda a cada usuario del sistema de recuperaci&oacute;n de  informaci&oacute;n. Para su despliegue se propone una arquitectura distribuida, (<a href="#f05">Fig.  5</a>). El procesamiento en este componente se encarga de dos actividades  fundamentales (Maldonado et al., 2017): Categorizaci&oacute;n de documentos: se  encarga de asignar una categor&iacute;a a cada uno de los documentos indexados  utilizando t&eacute;cnicas de miner&iacute;a web, que se a&ntilde;ade como un par&aacute;metro m&aacute;s en la  estructura del documento. Definici&oacute;n del perfil de usuario: se encarga de  clasificar las consultas insertadas por los usuarios usando t&eacute;cnicas de miner&iacute;a  de texto y asignar a cada uno de ellos un par&aacute;metro que recoge todas las  categor&iacute;as consultadas por el usuario. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0515118.jpg" alt="f05" width="455" height="385"><a name="f05"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Componente de  apoyo a la toma de decisiones</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Su funci&oacute;n principal es el procesamiento estad&iacute;stico de toda la informaci&oacute;n  almacenada en el sistema de recuperaci&oacute;n de informaci&oacute;n que se debe organizar  en dos tipos, los documentos almacenados y los perfiles de b&uacute;squeda de los  usuarios (Maldonado et al., 2017).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La informaci&oacute;n procesada se convierte en una fuente rica de conocimiento  para detectar tendencias de b&uacute;squeda de los usuarios de la red y as&iacute;  proporcionarles contenidos afines a sus gustos; adem&aacute;s de brindar datos sobre  los perfiles de publicaci&oacute;n de cada uno de los sitios web. El resultado final  de este componente es una serie de reportes estad&iacute;sticos que manejan datos  como:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Perfil de b&uacute;squeda de los usuarios</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Perfil de publicaci&oacute;n de los sitios</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Consultas m&aacute;s buscadas</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Preferencias de b&uacute;squedas por regiones geogr&aacute;ficas o &aacute;reas institucionales</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Porciento de publicaci&oacute;n de categor&iacute;as de un dominio espec&iacute;fico </font></p>   </li>     </ul>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0615118.jpg" alt="f06" width="452" height="430"><a name="f06"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para su despliegue se propone una arquitectura distribuida, (<a href="#f06">Fig. 6</a>), donde  se representa como el servidor de procesamiento extrae los datos relativos a  los documentos de los servidores de indexaci&oacute;n y los datos relacionados con los  perfiles de usuarios de los servidores de datos de usuarios.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Componente de  visualizaci&oacute;n</strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Es el encargado de brindarlos mecanismos necesarios a los usuarios para  insertar sus consultas y recibir los resultados m&aacute;s relevantes a trav&eacute;s de  interfaces de visualizaci&oacute;n. Estas interfaces cuentan con funcionalidades como:  registro de usuarios y la b&uacute;squeda avanzada; que permite realizar una b&uacute;squeda  especializada teniendo en cuenta 9 filtros principales (Leyva et al., 2016):</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Con alguna de las palabras:</strong> una b&uacute;squeda que devuelve resultados que contenga una o algunas de las  palabras del criterio de b&uacute;squeda.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Con todas las palabras:</strong> una b&uacute;squeda que devuelva resultados que contengan espec&iacute;ficamente  todas las palabras del criterio. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Con la frase exacta:</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"> una b&uacute;squeda que devuelva resultados que contengan espec&iacute;ficamente la  frase exacta introducida en el criterio de b&uacute;squeda.    <br>     <strong>Sin las palabras:</strong> una b&uacute;squeda que devuelva resultados que no contengan ninguna palabra  introducida en el criterio de b&uacute;squeda.    <br>     <strong>Sitio:</strong> permite buscar resultados propios de sitios o dominios.    <br>     <strong>Tipo de archivo:</strong> permite obtener archivos filtrados por tipos agrupados en pdf, html,  comprimidos y documentos word.     <br>     <strong>Idioma</strong>: permite obtener resultados en idioma ingl&eacute;s o espa&ntilde;ol.    <br>     <strong>&Uacute;ltima actualizaci&oacute;n</strong>: permite obtener resultados agrupados por intervalos de actualizaci&oacute;n  tales como: en cualquier momento, &uacute;ltimas 24 horas, &uacute;ltimo mes, &uacute;ltima semana y  &uacute;ltimo a&ntilde;o.    <br>     <strong>T&eacute;rminos que aparecen:</strong> permite obtener resultados que contengan el criterio de b&uacute;squeda en  distintas a&eacute;reas de las p&aacute;ginas donde se encontraron: t&iacute;tulo, contenido y url  de la p&aacute;gina,</font></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El componente de visualizaci&oacute;n se responsabiliza  adem&aacute;s de brindar distintas opciones de visualizaci&oacute;n para los reportes  estad&iacute;sticos brindados por el mecanismo de apoyo a la toma de decisiones. Para  su despliegue se propone una arquitectura distribuida, (<a href="#f07">Fig. 7</a>). </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0715118.jpg" alt="f07" width="523" height="395"><a name="f07"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El modelo propone como roles  imprescindibles para la administraci&oacute;n de un SRI y asegurar el correcto  funcionamiento de todos los componentes anteriormente abordados, las 5  especialidades que se muestran a continuaci&oacute;n (Maldonado et al., 2017): l&iacute;der  de proyecto, arquitecto de software, desarrollador, especialista en rastreo, especialista  en indexaci&oacute;n, especialista en procesamiento de informaci&oacute;n, especialista en  visualizaci&oacute;n de la informaci&oacute;n, especialista en procesamiento estad&iacute;stico, especialista  en redes y servidores y asegurador de la calidad del sistema.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la validaci&oacute;n del modelo se emplearon diferentes m&eacute;todos cualitativos  y cuantitativos, a continuaci&oacute;n, se expone un resumen de los resultados obtenidos.  El modelo fue aplicado en el desarrollo del Motor de B&uacute;squeda Ori&oacute;n V2. Este es  un SRI desarrollado en la   Universidad de las Ciencias Inform&aacute;ticas que permite el  rastreo y almacenamiento de la web cubana; para brindar resultados a los  usuarios que buscan informaci&oacute;n sobre los contenidos publicados en esta web. En  el momento de aplicar el modelo, el buscador Ori&oacute;n v2 se encontraba en la fase  de pruebas de los componentes principales desarrollados para la RI (rastreo, indexaci&oacute;n y  visualizaci&oacute;n). En el momento de instanciar el modelo, el proyecto responsable  de este SRI contaba con 4 roles (l&iacute;der de proyecto, desarrollador, analista,  administrador de la configuraci&oacute;n) y no exist&iacute;a un flujo de trabajo definido  que respondiera a las necesidades reales de un proceso de RI. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Pruebas aplicadas al algoritmo para el c&aacute;lculo de  relevancia de documentos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los resultados obtenidos despu&eacute;s de promediar los  valores de precisi&oacute;n y exhaustividad antes y despu&eacute;s de aplicar el modelo, se  muestran en la <a href="#t01">tabla 1</a>: </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/t0115118.jpg" alt="t01" width="423" height="183"><a name="t01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para comparar  los valores de precisi&oacute;n y exhaustividad antes y despu&eacute;s de aplicar el  algoritmo, se utiliz&oacute; el editor estad&iacute;stico STATGRAPHICS. Para comprobar si lo  datos se ajustan a una distribuci&oacute;n normal se realiz&oacute; la prueba de normalidad  Shafiro-Wilk. El valor de p &gt; 0,05 en los dos casos (valores de precisi&oacute;n y  valores de exhaustividad), demostr&oacute; que no existen problemas con la normalidad  de los datos. En ambos casos los valores del sesgo estandarizado y de curtosis  estandarizada, se encuentran dentro del rango esperado para datos provenientes  de una distribuci&oacute;n normal. La aplicaci&oacute;n de la prueba estad&iacute;stica T-student  permiti&oacute; comparar las medias obtenidas antes y despu&eacute;s. Los valores de p &lt;  0,5 obtenidos permiten rechazar la h0 que asegura la igualdad de  medias. En consecuencia queda demostrado que existe una diferencia  significativa entre las medias comparadas en ambos casos (precisi&oacute;n antes y  despu&eacute;s y exhaustividad antes y despu&eacute;s). De esta manera se comprueba  satisfactoriamente que el algoritmo propuesto para el c&aacute;lculo de la relevancia  mejora los resultados brindados a los usuarios en el SRI.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Pruebas aplicadas al proceso de clasificaci&oacute;n de  documentos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Debido a la importancia que posee el proceso de categorizaci&oacute;n como base  del c&aacute;lculo del PBU y las categor&iacute;as de los documentos, ambas variables  utilizadas en el algoritmo propuesto para el c&aacute;lculo de la relevancia de los  documentos, se decide realizar un experimento para evaluar el proceso de  clasificaci&oacute;n enfocado en las variables precisi&oacute;n de la categorizaci&oacute;n y la  tasa de acierto, teniendo como entrada la estructura de documentos propuesta en  el ep&iacute;grafe: Componente de procesamiento de informaci&oacute;n. La interpretaci&oacute;n de  los resultados obtenidos, demuestra que el categorizador utilizado tiene alto  grado de precisi&oacute;n (0,831) y permite una tasa de % 86,564 de acierto en la  clasificaci&oacute;n de documentos. Estos datos validan de forma positiva el correcto  funcionamiento del proceso de categorizaci&oacute;n propuesto.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El primer paso del experimento consiste en aplicar las pruebas de  rendimiento a la arquitectura del Motor de B&uacute;squeda Ori&oacute;n sin aplicar los  cambios que propone el modelo para as&iacute; determinar el estado de los indicadores  eficiencia y eficacia. Luego se aplican los cambios que propone el modelo a la  distribuci&oacute;n de los servidores y se obtienen los valores de las variables  definidas para efectuar una comparaci&oacute;n y llegar a conclusiones. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La interpretaci&oacute;n del valor de los indicadores y el estudio de la distribuci&oacute;n  de los servidores en el estado actual del Motor de B&uacute;squeda Ori&oacute;n, permiti&oacute;  detectar problemas en el balanceo de la carga de los servidores, la  disponibilidad de la informaci&oacute;n, el uso del almacenamiento y el tiempo de  respuesta a los usuarios. Al aplicar la distribuci&oacute;n de servidores propuesta  por el modelo, se solucionan los problemas detectados con anterioridad. Esto se  logra con el uso de los balanceadores de carga entre los rastreadores y los  indexadores y entre las interfaces web y los servidores de indexaci&oacute;n. Adem&aacute;s,  creando un mecanismo de r&eacute;plica de la informaci&oacute;n desde los servidores maestros  de indexaci&oacute;n hasta los indexadores esclavos. La adici&oacute;n de un nuevo  balanceador para responder a las peticiones de los usuarios permite eliminar el  cuello de botella que anteriormente exist&iacute;a en ese punto. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sobre los tiempos de respuestas se concluye que despu&eacute;s de aplicar las  modificaciones propuestas en el modelo, a pesar de que el flujo de inserci&oacute;n de  datos aument&oacute; en el segundo experimento y la cantidad de documentos almacenados  es mayor, el tiempo de respuestas es menor en un segundo que en el primer  experimento. Sobre la cantidad de documentos indexados, se concluye que con la  nueva distribuci&oacute;n de servidores se mejora en este aspecto; ya que los valores  de almacenamiento de documentos en el segundo experimento duplican a los  valores obtenidos en el primero. Los resultados obtenidos demuestran que el  modelo mejora la eficiencia y eficacia de la arquitectura del SRI Motor de  B&uacute;squeda Ori&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Valoraci&oacute;n de los expertos sobre el  modelo</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los resultados obtenidos al aplicar el escalamiento de  Likert (IP &gt; 89 en todos los casos), <a href="#f08">figura 8</a>, demuestran que los  principios del modelo, su estructura general y detallada y su pertinencia,  tienen una alta valoraci&oacute;n por parte de los expertos. A lo largo del proceso de  evaluaci&oacute;n se recogieron criterios positivos para el uso y aplicaci&oacute;n del  modelo computacional para el procesamiento de documentos y apoyo a la toma de  decisiones en SRI. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12n1/f0815118.jpg" alt="f08" width="489" height="200"><a name="f08"></a></p> <h2><font size="2"><a><font face="Verdana, Arial, Helvetica, sans-serif">Satisfacci&oacute;n de potenciales usuarios con  el modelo</font></a> </font></h2>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El modelo computacional propuesto tiene como  beneficiarios principales, tres grupos de usuarios con caracter&iacute;sticas distintas,  por lo que se decide aplicar la prueba en tres entornos distintos y utilizando  tres cuadros l&oacute;gicos de Iadov correspondientes a cada grupo. Los grupos de  usuarios son los siguientes: Usuarios que desarrollan SRI (UD), Usuarios que  toman decisiones (UTD), Usuarios que buscan informaci&oacute;n (UC).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t02">tabla 2</a> se muestran los  resultados del c&aacute;lculo del ISG en los tres grupos de usuarios: </font></p>     ]]></body>
<body><![CDATA[<p align="center"><img src="/img/revistas/rcci/v12n1/t0215118.jpg" alt="t02" width="500" height="62"><a name="t02"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los tres valores de ISG obtenidos se encuentran en el  intervalo de satisfacci&oacute;n, por lo que se puede concluir que la satisfacci&oacute;n de  los usuarios que se benefician del modelo  es alta. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El modelo computacional  desarrollado integra las variables: arquitectura de hardware, algoritmos para  el c&aacute;lculo de relevancia, recursos humanos, mecanismos de apoyo a la toma de  decisiones e integraci&oacute;n de los componentes de un SRI, lo que permite mejorar  la calidad de los resultados brindados a los usuarios y el apoyo a la toma de  decisiones. El algoritmo dise&ntilde;ado y fundamentado para el c&aacute;lculo de la  relevancia de documentos, permite brindar resultados a los usuarios m&aacute;s acordes  a sus necesidades de b&uacute;squedas y preferencias. La selecci&oacute;n de t&eacute;cnicas de  miner&iacute;a web permite un procesamiento de la informaci&oacute;n almacenada que sirve de  base para el c&aacute;lculo de la relevancia de los documentos y la extracci&oacute;n de  conocimiento sobre la Web  y su uso. La instanciaci&oacute;n del modelo en el SRI Motor de B&uacute;squeda Ori&oacute;n v2,  demostr&oacute; su aplicabilidad y viabilidad, adem&aacute;s contribuye al proceso de RI en  Cuba. Las t&eacute;cnicas utilizadas para la validaci&oacute;n del modelo, comprobaron que  los constructos del mismo est&aacute;n fundamentados sobre la base de tecnolog&iacute;as  reconocidas a nivel internacional en el campo de la RI y constataron el alto nivel  de satisfacci&oacute;n de los usuarios con respecto al modelo. </font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Baquerizo, R.  P.; Leyva, P. R.; Febles, J. P.; Viltres, H.; &amp; Estrada, V. S. Algorithm  for calculating relevance of documents in information retrieval systems, 2017.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Bl&aacute;zquez, M.  T&eacute;cnicas avanzadas de recuperaci&oacute;n de informaci&oacute;n: procesos, t&eacute;cnicas y  m&eacute;todos. E-Prints Complutense, Madrid, 2013, ISBN 978-84-695-8030-1. Disponible  en: http://mblazquez.es/wp-content/uploads/ebook-mbo-tecnicas-avanzadas-recuperacion-informacion1.pdf.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Diego, N.  T&eacute;cnicas de indexaci&oacute;n y recuperaci&oacute;n de documentos utilizando referencias  geogr&aacute;ficas y textuales. Universidade da Coru&ntilde;a. Departamento de Computaci&oacute;n,  2009, ISBN: 978-84-693-3270-2.     <br>   Disponible en:  https://books.google.com.cu/books?hl=es&amp;lr=&amp;id=Bd_QT3QgKLgC&amp;oi=fnd&amp;pg=PA5&amp;dq=Efficient+Information+Searching+on+the+Web:+A+Handbook+in+the+Art+of+Searching+for+Information.&amp;ots=-P3Kv0LEL6&amp;sig=-qKf7iPTHQtkIYrid5CadiZkW1g&amp;redir_esc=y#v=onepage&amp;q=Efficient%20Information%20Searching%20on%20the%20Web%3A%20A%20Handbook%20in%20the%20Art%20of%20Searching%20for%20Information.&amp;f=false.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Fransson, J. Efficient  Information Searching on the Web: A Handbook in the Art of Searching for  Information, 2010.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Jaimes, G &amp;  Vega, F. Modelos cl&aacute;sicos de recuperaci&oacute;n de la informaci&oacute;n. Revista  Integraci&oacute;n, 2005, 23(1). ISSN: 2145-8472. Disponible en: &lt;http://revistas.uis.edu.co/index.php/revistaintegracion/article/view/479. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Lafferty, J.; &amp; Zhai, C.  Document language models, query models, and risk minimization for information  retrieval. In ACM SIGIR Forum, 2017, 51(2), 251-259. DOI:  10.1145/3130348.3130375. Disponible en:  http://dl.acm.org/citation.cfm?id=3130375.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Leyva, P. R.;  Sala, H.V.; &amp; Flores, L. A. P. Componentes y funcionalidades de un sistema  de recuperaci&oacute;n de la informaci&oacute;n. Revista Cubana de Ciencias Inform&aacute;ticas,  2016, 10, 150-162.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mabel, S.  Buscadores: c&oacute;mo usar las herramientas de b&uacute;squeda en Internet. Informatio.  Revista del Instituto de Informaci&oacute;n de la Facultad de Informaci&oacute;n y Comunicaci&oacute;n, 2013, no  2.    </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Maldonado, P. D. C. O.; Leyva,  P. R., Febles, J. P.; Sala, H. V.; &amp; Mesa, Y. D. Computational model for  the processing of documents and support to the decision making in systems of  information retrieval, 2017.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">R&iacute;ssola, E. A.;  &amp; Tolosa, M. G. H. Gesti&oacute;n Eficiente del &Iacute;ndice Invertido para Flujos de  Documentos en Tiempo Real. (Tesis de licenciatura). Universidad Nacional de  Luj&aacute;n, Argentina, 2015.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sequera, J. C.  Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de  recuperaci&oacute;n de informaci&oacute;n. Tesis Doctoral. Universidad de Alcal&aacute;, 2010,  p&aacute;gina 23, 3 p&aacute;rrafo.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">V&aacute;squez, A. C.; Fern&aacute;ndez, C. L. Aprendizaje de  perfiles de usuario web para modelizar interfaces adaptativas. Theorema, segunda  &eacute;poc, 2016, no 3, p. 155-164.     </font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 11/12/2017    <br> Aceptado: 22/01/2015</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Baquerizo]]></surname>
<given-names><![CDATA[R. P]]></given-names>
</name>
<name>
<surname><![CDATA[Leyva]]></surname>
<given-names><![CDATA[P. R]]></given-names>
</name>
<name>
<surname><![CDATA[Febles]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
<name>
<surname><![CDATA[Viltres]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Estrada]]></surname>
<given-names><![CDATA[V. S]]></given-names>
</name>
</person-group>
<source><![CDATA[Algorithm for calculating relevance of documents in information retrieval systems]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Blázquez]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Técnicas avanzadas de recuperación de información: procesos, técnicas y métodos.]]></source>
<year>2013</year>
<publisher-name><![CDATA[E-Prints Complutense]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Diego]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Técnicas de indexación y recuperación de documentos utilizando referencias geográficas y textuales.]]></source>
<year>2009</year>
<publisher-name><![CDATA[Universidade da Coruña]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fransson]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Efficient Information Searching on the Web: A Handbook in the Art of Searching for Information]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jaimes]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Vega]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Modelos clásicos de recuperación de la información.]]></article-title>
<source><![CDATA[]]></source>
<year>2005</year>
<volume>23</volume>
<numero>1</numero>
<issue>1</issue>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lafferty]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Zhai]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Document language models, query models, and risk minimization for information retrieval.]]></article-title>
<source><![CDATA[]]></source>
<year>2017</year>
<volume>51</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>251-259</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Leyva]]></surname>
<given-names><![CDATA[P. R]]></given-names>
</name>
<name>
<surname><![CDATA[Sala]]></surname>
<given-names><![CDATA[H.V]]></given-names>
</name>
<name>
<surname><![CDATA[Flores]]></surname>
<given-names><![CDATA[L. A. P]]></given-names>
</name>
</person-group>
<source><![CDATA[Componentes y funcionalidades de un sistema de recuperación de la información.]]></source>
<year>2016</year>
<volume>10</volume>
<page-range>150-162</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mabel]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Buscadores: cómo usar las herramientas de búsqueda en Internet]]></source>
<year>2013</year>
<volume>2</volume>
<publisher-name><![CDATA[Informatio. Revista del Instituto de Información de la Facultad de Información y Comunicación]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Maldonado]]></surname>
<given-names><![CDATA[P. D. C. O]]></given-names>
</name>
<name>
<surname><![CDATA[Leyva]]></surname>
<given-names><![CDATA[P. R.]]></given-names>
</name>
<name>
<surname><![CDATA[Febles]]></surname>
<given-names><![CDATA[J. P]]></given-names>
</name>
<name>
<surname><![CDATA[Sala]]></surname>
<given-names><![CDATA[H. V]]></given-names>
</name>
<name>
<surname><![CDATA[Mesa]]></surname>
<given-names><![CDATA[Y. D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Computational model for the processing of documents and support to the decision making in systems of information retrieval]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ríssola]]></surname>
<given-names><![CDATA[E. A]]></given-names>
</name>
<name>
<surname><![CDATA[Tolosa]]></surname>
<given-names><![CDATA[M. G. H.]]></given-names>
</name>
</person-group>
<source><![CDATA[Gestión Eficiente del Índice Invertido para Flujos de Documentos en Tiempo Real.]]></source>
<year>2015</year>
<publisher-name><![CDATA[Universidad Nacional de Luján]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sequera]]></surname>
<given-names><![CDATA[J. C]]></given-names>
</name>
</person-group>
<source><![CDATA[Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de recuperación de información.]]></source>
<year>2010</year>
<publisher-name><![CDATA[Universidad de Alcalá]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vásquez]]></surname>
<given-names><![CDATA[A. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández]]></surname>
<given-names><![CDATA[C. L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Aprendizaje de perfiles de usuario web para modelizar interfaces adaptativas.]]></source>
<year>2016</year>
<volume>3</volume>
<page-range>155-164</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
