<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992018000500011</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Coseno contextual para enriquecer semánticamente y comparar textos cortos generados por herramientas de Gestión de Proyectos.]]></article-title>
<article-title xml:lang="en"><![CDATA[Contextual cosine for semantic enrichment and comparison of short texts generated by Project Management tools.]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Piedra Diéguez]]></surname>
<given-names><![CDATA[Laynier A.]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Torres López]]></surname>
<given-names><![CDATA[Surayne]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Medina Pagola]]></surname>
<given-names><![CDATA[José E.]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rivero Hechavarría]]></surname>
<given-names><![CDATA[Claudia C.]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Laboratorio de Investigaciones en Gestión de Proyectos Universidad de las Ciencias Informáticas ]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Senior Researcher Universidad de las Ciencias Informáticas ]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>00</month>
<year>2018</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>00</month>
<year>2018</year>
</pub-date>
<volume>12</volume>
<fpage>151</fpage>
<lpage>162</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992018000500011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992018000500011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992018000500011&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El análisis de textos cortos ha sido un problema a tratar durante los procesos automáticos de apoyo a la toma de decisiones debido a la escasa información que contienen. Las herramientas de gestión de proyectos generan este tipo de textos y es necesario darles un tratamiento adecuado para obtener resultados válidos y confiables. En la herramienta Xedro-GESPRO, a partir del análisis de las evidencias del desempeño de los recursos humanos, es generado un modelo evaluación de competencias laborales en proyectos, este modelo se implementó sin una variante que utilizara información semántica o contextual para la comparación de los textos y dichas evidencias, al igual que las competencias laborales, constituyen textos cortos. Para dar tratamiento a este problema se propuso utilizar un modelo basado en redes neuronales artificiales (RNA). Concretamente el modelo propuesto fue capaz de capturar información semántica de un corpus textual especializado en la gestión de proyectos mejorando el análisis actual de los indicadores que se utilizan para la evaluación de competencias laborales. No solo demostró que es posible lidiar efectivamente con los problemas de procesamiento de lenguaje natural asociados a textos cortos sin afectar la eficiencia y mejorando significativamente la efectividad y validez del proceso, sino que además fue capaz de capturar la relación entre términos mal escritos o en otro idioma (inglés).]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The short texts analysis has been a problem to deal with, during the automatic decision support processes, due to the limited information they contain. The project management tools generate this type of texts and it is necessary to give them the most appropriate treatment to obtain valid and reliable results. In the Xedro-GESPRO tool, based on the analysis of the evidence of human resources’ performance, an evaluation model of labor competencies in projects is generated. This model was implemented without a variant that considered semantic or contextual information for the texts comparison, but the previously mentioned evidences, as well as labor competencies, are short texts. To deal with this problem, it was suggested to use a model based on artificial neural networks (ANN). Specifically, the proposed model was able to capture semantic information from a specialized in project management textual corpus, and improved the current analysis of the indicators that are used for the evaluation of labor competencies. The model not only showed that it is possible to deal effectively with the problems of natural language processing associated with short texts without affecting efficiency and significantly improving the effectiveness and validity of the process but to capture relationship between bad written terms or English words.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[competencias laborales]]></kwd>
<kwd lng="es"><![CDATA[evaluación de desempeño]]></kwd>
<kwd lng="es"><![CDATA[gestión de proyectos]]></kwd>
<kwd lng="es"><![CDATA[información semántica]]></kwd>
<kwd lng="es"><![CDATA[PLN]]></kwd>
<kwd lng="es"><![CDATA[redes neuronales]]></kwd>
<kwd lng="es"><![CDATA[similitud de textos]]></kwd>
<kwd lng="es"><![CDATA[textos cortos]]></kwd>
<kwd lng="en"><![CDATA[knowledge discovery]]></kwd>
<kwd lng="en"><![CDATA[project management]]></kwd>
<kwd lng="en"><![CDATA[information recovery]]></kwd>
<kwd lng="en"><![CDATA[short texts]]></kwd>
<kwd lng="en"><![CDATA[text similarity]]></kwd>
<kwd lng="en"><![CDATA[PLN]]></kwd>
<kwd lng="en"><![CDATA[Word2Vec]]></kwd>
<kwd lng="en"><![CDATA[skip-gram]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4" face="Verdana, Arial, Helvetica, sans-serif"><strong>Coseno  contextual para enriquecer sem&aacute;nticamente y comparar  textos cortos generados por herramientas de Gesti&oacute;n de Proyectos.</strong></font></p>     <p>&nbsp;</p>     <p><em><strong><font size="3" face="Verdana, Arial, Helvetica, sans-serif">Contextual cosine for semantic enrichment  and comparison of short texts generated by Project Management tools.</font></strong></em></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Laynier A. Piedra Di&eacute;guez<strong><sup>1</sup><strong><sup>*</sup></strong></strong>, Surayne Torres L&oacute;pez<strong><strong><sup>1</sup></strong></strong>, Jos&eacute; E. Medina Pagola<strong><sup>2</sup></strong>, Claudia C. Rivero  Hechavarr&iacute;a<strong><sup>1</sup></strong></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Laboratorio  de Investigaciones en Gesti&oacute;n de Proyectos, Universidad de las Ciencias  Inform&aacute;ticas, Cuba, Carretera a San Antonio de Ba&ntilde;os Km 2 1&frasl;2, Boyeros, La  Habana, Cuba. {laynier, storres}@uci.cu, ccrivero@nauta.cu</font>    <br>   <font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>2</sup>Senior Researcher,  Universidad de las Ciencias Inform&aacute;ticas, Cuba, Carretera a San Antonio de  Ba&ntilde;os Km 2 1&frasl;2, Boyeros, La Habana, Cuba. jmedinap@uci.cu</font>    ]]></body>
<body><![CDATA[<br>       <br> </p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> laynier@uci.cu</font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El an&aacute;lisis de textos cortos ha sido un problema a  tratar durante los procesos autom&aacute;ticos de apoyo a la toma de decisiones debido  a la escasa informaci&oacute;n que contienen. Las herramientas de gesti&oacute;n de proyectos  generan este tipo de textos y es necesario darles un tratamiento adecuado para  obtener resultados v&aacute;lidos y confiables. En la herramienta Xedro-GESPRO, a  partir del an&aacute;lisis de las evidencias del desempe&ntilde;o de los recursos humanos, es  generado un modelo evaluaci&oacute;n de competencias laborales en proyectos, este  modelo se implement&oacute; sin una variante que utilizara informaci&oacute;n sem&aacute;ntica o  contextual para la comparaci&oacute;n de los textos y dichas evidencias, al igual que  las competencias laborales, constituyen textos cortos. Para dar tratamiento a  este problema se propuso utilizar un modelo basado en redes neuronales  artificiales (RNA). Concretamente el modelo propuesto fue capaz de capturar  informaci&oacute;n sem&aacute;ntica de un corpus textual especializado en la gesti&oacute;n de  proyectos mejorando el an&aacute;lisis actual de los indicadores que se utilizan para  la evaluaci&oacute;n de competencias laborales. No solo demostr&oacute; que es posible lidiar  efectivamente con los problemas de procesamiento de lenguaje natural asociados  a textos cortos sin afectar la eficiencia y mejorando significativamente la  efectividad y validez del proceso, sino que adem&aacute;s fue capaz de capturar la  relaci&oacute;n entre t&eacute;rminos mal escritos o en otro idioma (ingl&eacute;s). </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b> competencias  laborales, evaluaci&oacute;n de desempe&ntilde;o, gesti&oacute;n de proyectos, informaci&oacute;n  sem&aacute;ntica, PLN, redes neuronales, similitud de textos, textos cortos.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p align="justify"><font size="2"><em><font face="Verdana, Arial, Helvetica, sans-serif">The short  texts analysis has been a problem to deal with, during the automatic decision  support processes, due to the limited information they contain. The project  management tools generate this type of texts and it is necessary to give them  the most appropriate treatment to obtain valid and reliable results. In the  Xedro-GESPRO tool, based on the analysis of the evidence of human resources&rsquo;  performance, an evaluation model of labor competencies in projects is  generated. This model was implemented without a variant that considered  semantic or contextual information for the texts comparison, but the previously  mentioned evidences, as well as labor competencies, are short texts. To deal  with this problem, it was suggested to use a model based on artificial neural  networks (ANN). Specifically, the proposed model was able to capture semantic  information from a specialized in project management textual corpus, and  improved the current analysis of the indicators that are used for the  evaluation of labor competencies. The model not only showed that it is possible  to deal effectively with the problems of natural language processing associated  with short texts without affecting efficiency and significantly improving the  effectiveness and validity of the process but to capture relationship between  bad written terms or English words.</font></em></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b></font> <em><font size="2" face="Verdana, Arial, Helvetica, sans-serif">knowledge discovery,  project management, information recovery, short texts, text similarity, PLN,  Word2Vec, skip-gram </font></em></p> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La industria del software, una  de las de mayor crecimiento e impacto en el mundo, contin&uacute;a creciendo y  generando tecnolog&iacute;as para mejorar el desempe&ntilde;o humano en cualquier &aacute;rea de la  ciencia (Mon, Del   Giorgio, &amp; Querel, 2017). La  consecuente  complejidad que las organizaciones adquieren con el tiempo al crecer, necesita  una gesti&oacute;n por competencias que permita contar con un personal calificado para  garantizar el desarrollo exitoso de cada una de las tareas&nbsp;(Garc&eacute;s Hern&aacute;ndez, 2017) . Se manifiesta en m&aacute;s de un momento de la gesti&oacute;n de  los recursos humanos, tanto en la selecci&oacute;n (Garc&eacute;s Hern&aacute;ndez, 2017), como en la  conformaci&oacute;n de equipos y dichos autores la han considerado fundamental para  alcanzar los objetivos de la misi&oacute;n de la organizaci&oacute;n.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="2">Competencias  laborales. MEC-GP.    <br> </font></strong> <font size="2">    <br>   La gesti&oacute;n  empresarial en Cuba necesita de un enfoque acorde a la din&aacute;mica internacional,  a la cual est&aacute; m&aacute;s cerca cada vez debido a las oportunidades de inversi&oacute;n  extranjera, las nuevas empresas establecidas en la Zona Especial de Desarrollo  del Mariel, y los convenios de negocio que se establecen con numerosos pa&iacute;ses&nbsp;(Mart&iacute;nez   Garc&iacute;a , 2018).  De esta necesidad nacen los apartados relacionados con las competencias  laborales en los Lineamientos para la Pol&iacute;tica Econ&oacute;mica y Social del Partido y  la Revoluci&oacute;n, establecidos en 2011, actualizados en 2017 y en constante  an&aacute;lisis y seguimiento&nbsp;(Mart&iacute;nez Hern&aacute;ndez &amp; Puig   Meneses, 2018).     <br>       <br>   En 2011 el Dr.  Armando Cuesta public&oacute; un art&iacute;culo presentando una metodolog&iacute;a de gesti&oacute;n por  competencias basada en la norma cubana NC 3000-3002:2007. Para esta  investigaci&oacute;n se bas&oacute; en un estudio de numerosas empresas cubanas que estaban  siguiendo un enfoque basado en competencias&nbsp;(Cuesta Santos A. R., 2011). Cuesta, citando la  NC 3001: 2007, sit&uacute;a a las competencias laborales como el centro de una figura  en la que los procesos clave de la gesti&oacute;n de recursos humanos est&aacute;n alrededor  y menciona la tecnolog&iacute;a como relevante para resolver los problemas pr&aacute;cticos  de forma sistem&aacute;tica y racional&nbsp;(Cuesta Santos A. , 2016).    ]]></body>
<body><![CDATA[<br>       <br>   Una de las  caracter&iacute;sticas que se se&ntilde;ala como fundamental en las competencias es que sean  observables&nbsp;(Torres L&oacute;pez   S. , 2015)  obviamente esto supone la posibilidad de medirlas. Estas mediciones pueden  realizarse mediante diferentes m&eacute;todos relacionados con pruebas, an&aacute;lisis de  resultados de entrevistas (Garc&eacute;s Hern&aacute;ndez, 2017), y a partir de las  evidencias que se recogen de los procesos en los que interviene el trabajador&nbsp;(Torres L&oacute;pez   S. , 2015).    <br>        <br>   En 2015 se  presenta una investigaci&oacute;n m&aacute;s completa que automatiza el proceso de evaluaci&oacute;n  basado en competencias y lo formaliza dentro de un modelo, desde la definici&oacute;n  de las competencias, las evidencias del desempe&ntilde;o y la relaci&oacute;n de ambos  elementos con el desempe&ntilde;o laboral&nbsp;(Torres L&oacute;pez   S. , 2015).  Este modelo: &ldquo;Modelo de evaluaci&oacute;n de competencias a partir de evidencias  durante la gesti&oacute;n de proyectos&rdquo;, en lo adelante MEC-GP, implementado sobre la  herramienta de gesti&oacute;n de proyectos Xedro-GESPRO, constituye un referente  fundamental para la presente investigaci&oacute;n.    <br>       <br>   <strong>Similitud coseno sobre MEC-GP</strong>    <br>       <br>   Entre las  medidas de similitud m&aacute;s conocidas dentro de la Recuperaci&oacute;n de Informaci&oacute;n (IR) tanto por su aplicaci&oacute;n como por  su efectividad se encuentran las que calculan las distancias, ya sea entre  caracteres de un t&eacute;rmino, como entre t&eacute;rminos de una cadena o entre documentos  en grandes corpus textuales. Otras t&eacute;cnicas se basan en modelos de  representaci&oacute;n y an&aacute;lisis, en ocasiones utilizando aprendizaje autom&aacute;tico,  supervisado o no. &nbsp;Dentro de las t&eacute;cnicas  y modelos mencionados anteriormente, destacan nombres como Smith-Waterman,  Jaro, n-gramas, Monge-Elkan, TF-IDF, distancia euclidiana, coeficientes Dice,  coseno y Jaccard, an&aacute;lisis sem&aacute;ntico latente (LSA), an&aacute;lisis sem&aacute;ntico  expl&iacute;cito (ESA) y varios otros, no solo para el trabajo de similitud o clasificaci&oacute;n  de textos sino tambi&eacute;n para el an&aacute;lisis de im&aacute;genes e incluso el cotejo  texto-imagen&nbsp;(Torres L&oacute;pez &amp; Arco Garc&iacute;a,   2016)&nbsp;(Am&oacute;n &amp;   Jim&eacute;nez, 2010)&nbsp;(Gomaa &amp;   Fahmy, 2013)&nbsp;(Wang, Li,   Huang, &amp; Lazebnik, 2018).    <br>       <br>   En su caso, MEC-GP  utiliza la similitud coseno para determinar la correspondencia entre evidencias  y competencias, a continuaci&oacute;n, calcula varios indicadores. Una red neuronal  previamente entrenada recibe estos indicadores y propone una evaluaci&oacute;n. Esta  evaluaci&oacute;n del sistema no solo apoya la evaluaci&oacute;n de desempe&ntilde;o sino tambi&eacute;n la  toma de decisiones en cuanto a capacitaci&oacute;n o entrenamiento del personal&nbsp;(Torres L&oacute;pez   S. , 2015).    ]]></body>
<body><![CDATA[<br>       <br>   Un momento  cr&iacute;tico y con alto impacto en todo el sistema debido a que es punto de partida,  es el momento en que se aplica la distancia coseno para determinar: qu&eacute;  evidencias se utilizar&aacute;n para evaluar qu&eacute; competencias. Dada la naturaleza de  los datos analizados, la utilizaci&oacute;n de esta medida de similitud no es la mejor  alternativa a implementar, dado que son textos cortos&nbsp;(Torres L&oacute;pez,   Aldana Cuza, Pi&ntilde;ero Perez, &amp; Piedra Di&eacute;guez, 2016), y la medida de  similitud coseno utiliza la frecuencia de aparici&oacute;n de los t&eacute;rminos como base  para los c&aacute;lculos posteriores del procedimiento.     <br>       <br>   Uno de los problemas  de utilizar la similitud coseno sobre textos cortos son los propios vectores  necesarios para calcular esta medida. Estos vectores se forman a partir de los  pesos de los t&eacute;rminos a comparar. Los pesos se calculan a partir de la frecuencia  de aparici&oacute;n de los t&eacute;rminos en el documento o cuerpo de documentos a analizar,  mediante la muy conocida estad&iacute;stica TF-IDF&nbsp;(Sparck Jones, 1972) (Zimniewicz, Kurowski, &amp; W&#281;glarz, 2018) (Slamet, y otros, 2018).    <br>        <br>   <strong>Distribuci&oacute;n sem&aacute;ntica propuesta</strong>    <br>       <br>   Regresando al modelo en cuesti&oacute;n resulta evidente que, en textos cortos  como los generados por Xedro-GESPRO como evidencia del desempe&ntilde;o o competencia  a evaluar, la frecuencia de aparici&oacute;n de un t&eacute;rmino es muy baja, as&iacute; disminuye  la efectividad de la medida TF-IDF y, en consecuencia, los resultados y la  aplicabilidad de la similitud coseno. Otro de los problemas fundamentales de la  IR actualmente es la recuperaci&oacute;n de informaci&oacute;n en textos cortos, por la poca  informaci&oacute;n que de ellos puede extraerse sem&aacute;nticamente&nbsp;(&Aacute;lvarez   Carmona, 2014)&nbsp;(Song, Zhen   Liang, Long Cao, &amp; Cheol Park, 2014).    <br>       <br>   La aplicaci&oacute;n de t&eacute;cnicas basadas en conteo o en la morfolog&iacute;a de las  palabras no es suficiente para realizar an&aacute;lisis de textos cortos. Tambi&eacute;n debe  considerarse la sem&aacute;ntica, la cual est&aacute; determinada por el contexto en que se  encuentra cada palabra analizada. Se coincide en que contextos similares  tendr&aacute;n -adem&aacute;s de palabras similares-, t&eacute;rminos relacionados sem&aacute;nticamente&nbsp;(Altszyler   &amp; Brusco, 2015). Conociendo el significado de las  palabras se puede obtener una comprensi&oacute;n global de la oraci&oacute;n que las contiene.  Esta es la manera en que los seres humanos utilizan el lenguaje natural,  analizando las palabras en relaci&oacute;n con sus palabras m&aacute;s cercanas, es decir: su  contexto (Carrasco G&oacute;mez, 2017). Entonces se define  el contexto de una palabra como el conjunto compuesto por las palabras  alrededor de la que se analice en el texto.     ]]></body>
<body><![CDATA[<br>       <br>   Basado en lo anterior se han desarrollado algunos trabajos que explotan las  posibilidades de las RNA para mejorar numerosas t&eacute;cnicas de Procesamiento de  Lenguaje Natural (PLN), entre las que se encuentran la clasificaci&oacute;n y la  representaci&oacute;n vectorial de textos, enmarcados en el paradigma que se ha dado a  conocer como <em>Word</em> <em>embeddings (Bengio, Schwenk, &amp; Senecal,   2006)</em>.Uno  de los modelos m&aacute;s populares de este paradigma es el Word2Vec&nbsp;(Mikolov, Yih, &amp; Zweig, 2013), el cual permite  capturar informaci&oacute;n tanto sint&aacute;ctica como sem&aacute;ntica de las palabras.     <br>       <br>   Uno de los modelos que contiene Word2Vec permite obtener el contexto a  partir de una palabra (modelo skip-gram)&nbsp;(Mikolov, Le,   &amp; Sutskever, 2013). En este caso se puede notar que a  diferencia de la escasa informaci&oacute;n que ofrece una palabra a partir de un  n&uacute;mero significando su peso o relevancia, com&uacute;nmente TF-IDF, para Word2Vec cada  palabra tiene todo un vector continuo de representaci&oacute;n. </font></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Entre los modelos Word2Vec, sus autores recomiendan Skip-gram por sus  &ldquo;mejores representaciones de palabras cuando los datos monoling&uuml;es son  peque&ntilde;os&rdquo;&nbsp;(Mikolov, Le,   &amp; Sutskever, 2013).    <br>        <br> El modelo utilizado contiene una evoluci&oacute;n del skip-gram, ya que, aunque  basado en &eacute;l, se reconoce adem&aacute;s la morfolog&iacute;a de las palabras debido a que se representa  cada palabra como una bolsa de n-gramas de texto representados vectorialmente,  siendo una palabra una sumatoria de estos n-gramas&nbsp;(Bojanowski,   Grave, Joulin, &amp; Mikolov, 2017). Esto permite adem&aacute;s  reconocer similitudes a palabras mal escritas y palabras en otros idiomas que  comparten similar morfolog&iacute;a, ejemplo: &ldquo;instalador&rdquo; e &ldquo;<em>installer</em>&rdquo;. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12s1/f0111518.png" alt="f01" width="458" height="477"><a name="f01"></a></p>     ]]></body>
<body><![CDATA[<p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="#f01">Figura  1</a>. Arquitectura de Skip-gram</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La base textual para entrenar el modelo en este caso, la constituyen  t&eacute;rminos espec&iacute;ficos de la gesti&oacute;n de proyectos, y relacionados con las  competencias laborales y las evidencias del desempe&ntilde;o en la producci&oacute;n y el  desarrollo de software, la investigaci&oacute;n y la capacitaci&oacute;n en pre y postgrado  de varios centros de desarrollo de software. M&aacute;s de cien mil seiscientos  t&eacute;rminos se utilizan para entrenamiento del modelo.    <br>       <br>   Cada t&eacute;rmino asociado a las tareas/competencias, genera un contexto al cual  se le pueden determinar las representaciones vectoriales de sus t&eacute;rminos para  una vez concatenados dichos vectores, se les pueda calcular la similitud  coseno.    <br>       <br>   Para el dise&ntilde;o de los experimentos se utiliz&oacute; un procedimiento similar al  contenido en MEC-GP, sin embargo, se modific&oacute; el segundo paso del procesamiento  para incluir la extracci&oacute;n de informaci&oacute;n sem&aacute;ntica de cada t&eacute;rmino y la  computaci&oacute;n de los vectores de t&eacute;rminos utilizando similitud coseno.  Adicionalmente, se incluy&oacute; en estos vectores contextuales la cadena original de  la manera:    <br>       <br> Siendo X e Y dos textos  a las que se les desea calcular la similitud, esta se podr&aacute; calcular como,</font></p>     <p align="center"><img src="/img/revistas/rcci/v12s1/fo0111518.png" alt="fo01" width="259" height="23"></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde <em>Cx</em> y <em>Cy</em> son los <em>k</em> t&eacute;rminos m&aacute;s  cercanos a <em>X</em> e <em>Y</em> respectivamente en el modelo, o sea: pertenecen al contexto de  cada texto a comparar.    ]]></body>
<body><![CDATA[<br>       <br>   En lo adelante se le llamar&aacute; coseno contextual (sCC) a esta medida de  similitud conseguida a partir del modelo empleado.    <br>       <br> Es posible tambi&eacute;n determinar la distribuci&oacute;n vectorial (<em>embeddings</em>) del t&eacute;rmino independiente, o  sea, sin la sumatoria de las distribuciones de sus contextos. Ambas pruebas se  realizaron sobre el modelo resultante y se recomend&oacute; la de mejores resultados  como se muestra en la secci&oacute;n siguiente.</font></p>     <p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="/img/revistas/rcci/v12s1/f0211518.png" target="_blank">Figura 2</a>. Esquema del  c&aacute;lculo de semejanza Coseno Contextual (sCC).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="2">Herramientas</font></strong><font size="2">    <br>       <br>   El proceso experimental se realiz&oacute; sobre el marco de trabajo R con la ayuda  de la herramienta <em>RStudio</em> para  automatizar el procesamiento. Tanto la creaci&oacute;n del modelo de RNA tipo  skip-gram como la similitud final se prepararon en este lenguaje, habitualmente  utilizado para procesamientos estad&iacute;sticos, pero extensible a trav&eacute;s de un  sistema de paquetes a otras funciones como el aprendizaje autom&aacute;tico y la  miner&iacute;a de datos, y a otros lenguajes como C++, Java, Python, entre otros&nbsp;(Rahlf, 2017).     <br>       <br>   El proceso de preparaci&oacute;n  del modelo se realiza a partir de m&aacute;s de un corpus especializado en la gesti&oacute;n  de proyectos, libre de <em>stopwords</em>.  Se utiliza una implementaci&oacute;n de <em>word  embeddings</em> en el paquete de R &ldquo;fastrtext&rdquo;&nbsp;(Benesty, 2018) el cual implementa  la representaci&oacute;n vectorial de las palabras publicada por Bojanowski, &nbsp;Mikolov y otros en 2016: <em>Enriching Word Vectors with Subword Information&nbsp;(Bojanowski,   Grave, Joulin, &amp; Mikolov, 2017).</em> Algunos  paquetes adicionales se utilizaron para procesar el texto autom&aacute;ticamente, y  asistir el c&aacute;lculo del sCC, sin embargo, todas estas operaciones secundarias  pueden realizarse con los comandos b&aacute;sicos de la herramienta.</font></font></p>     ]]></body>
<body><![CDATA[<p align="left">&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la obtenci&oacute;n de los resultados que se mostrar&aacute;n en esta secci&oacute;n se  utiliz&oacute; el juego de datos mencionado en secciones anteriores para entrenar un  modelo basado en Skip-gram. Este modelo gener&oacute; los contextos necesarios para  cada t&eacute;rmino en las comparaciones realizadas. Se probaron los textos que MEC-GP  hab&iacute;a comparado previamente usando el coseno simple para determinar si sCC  obten&iacute;a mejores resultados, siendo capaz de encontrar relaci&oacute;n entre los textos  donde MEC-GP hab&iacute;a obtenido una pobre relaci&oacute;n o no hab&iacute;a encontrado ninguna.     <br>       <br>   La aplicaci&oacute;n del modelo mostr&oacute; un desempe&ntilde;o satisfactorio para realizar la  generaci&oacute;n de contextos para miles de t&eacute;rminos. Posterior a eso, se realizaron  m&aacute;s de 30 600 comparaciones vectoriales usando similitud coseno. Todo el  procedimiento del coseno contextual: tomar cada evidencia del desempe&ntilde;o,  generar contextos para cada uno de sus t&eacute;rminos, concatenarlos y compararlos  con cada posible dimensi&oacute;n tom&oacute; cerca de dos minutos, por lo que el  procedimiento es capaz de generar y comparar millones de contextos en pocas  horas.    <br>        <br> En la <a href="#f03">Figura 3</a> se observa c&oacute;mo sCC contiene los resultados del coseno  simple, pero encuentra mayores valores de similitud, constituy&eacute;ndose no en una  medida aparte, sino una mejora o un enriquecimiento sem&aacute;ntico de la medida  original.</font></p>     <p align="center"><img src="/img/revistas/rcci/v12s1/f0311518.png" alt="f03" width="330" height="263"><a name="f03"></a></p>     <p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="#f03">Figura 3.</a> Gr&aacute;fico Radial:  Algunos resultados de Coseno Contextual (sCC) y coseno original.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t02">Tabla 2</a> se puede apreciar como sCC encuentra un grado de similitud  mayor que la similitud coseno original, la cual no contiene informaci&oacute;n  sem&aacute;ntica de los t&eacute;rminos que compara, y al tratarse de textos cortos tampoco  puede apoyarse en la relevancia. Este resultado soluciona la dificultad del  paso correspondiente en MEC-GP, en que obligaba a establecer un umbral de corte  extremadamente bajo para poder utilizar los resultados, lo cual aumentaba el  riesgo de incluir resultados incorrectos, resultando al final en una propuesta  de evaluaci&oacute;n de desempe&ntilde;o err&oacute;nea o menos precisa del trabajador.</font></p>     ]]></body>
<body><![CDATA[<p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="#t02">Tabla 2</a>. Comparaci&oacute;n entre los resultados.</font></p>     <p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><img src="/img/revistas/rcci/v12s1/t0211518.png" alt="t02" width="545" height="155"><a name="t02"></a></font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Todav&iacute;a m&aacute;s, en numerosos casos donde el coseno simple es  cero, sCC es capaz de encontrar alg&uacute;n grado de semejanza, coincidiendo con el  criterio de los expertos utilizados durante la concepci&oacute;n de MEC-GP. Obviamente  existen casos en los que no existe similitud, lo cual es natural y esperado ya  que el valor de semejanza significa la correspondencia entre las tareas  desempe&ntilde;adas y las dimensiones de las competencias esperadas del individuo,  donde se puede esperar la relaci&oacute;n de una a varias, pero nunca de una a todas.</font></p>     <p align="center">    <br>   <font size="2" face="Verdana, Arial, Helvetica, sans-serif">  <a href="#t03">Tabla 3</a>. El sCC  descubre semejanzas donde no lo consigue el coseno simple. </font></p>     <p align="center"><img src="/img/revistas/rcci/v12s1/t0311518.png" alt="t03" width="546" height="137"><a name="t03"></a></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Es innegable  que esta medici&oacute;n (sCC) depende del enriquecimiento sem&aacute;ntico que se haga de  los textos a comparar, y en este caso se opt&oacute; por un enriquecimiento peque&ntilde;o  con el objetivo de no obtener resultados excesivamente optimistas; sin embargo,  es posible aportar una mayor carga sem&aacute;ntica al contexto de cada t&eacute;rmino con el  objetivo de elevar la calidad de las cadenas de texto. El debate rondar&aacute; en  cu&aacute;ntos t&eacute;rminos nuestro cerebro necesita para encontrarle significado a una  palabra central dentro de ellos. Esto puede estar influenciado por el &aacute;rea del  conocimiento que se analice y por el lenguaje o idioma en que los textos se  encuentren. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se cre&oacute; una medida de similitud que permiti&oacute; detectar con mayor profundidad  la semejanza entre dos textos cortos. El procesamiento de textos cortos pudo  mejorarse con la adici&oacute;n de informaci&oacute;n sem&aacute;ntica a la medida de similitud  utilizada, resultando en una mejor medici&oacute;n, que tiene en cuenta las  caracter&iacute;sticas del idioma y del &aacute;rea de aplicaci&oacute;n del procedimiento.    ]]></body>
<body><![CDATA[<br>       <br>   En el contexto de la gesti&oacute;n de proyectos esta medida de semejanza permiti&oacute;  ubicar mejor la correspondencia entre evidencias del desempe&ntilde;o laboral y  competencias esperadas de los integrantes de los proyectos.    <br>       <br> No solo fue posible detectar relaciones sem&aacute;nticas entre los t&eacute;rminos a  partir del modelo sino adem&aacute;s extraer otros con errores lexicogr&aacute;ficos, o en  otros idiomas, como el ingl&eacute;s. Esto mejora tambi&eacute;n la validez interna del  modelo dado que en la din&aacute;mica del uso de las herramientas de gesti&oacute;n de  proyectos se producen errores de escritura o se utilizan t&eacute;rminos que son  comunes de dicha &aacute;rea del conocimiento, pero extra&ntilde;os al lenguaje o el idioma.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Altszyler,   E., &amp; Brusco, P. (2015). An&aacute;lisis de la din&aacute;mica del contenido sem&aacute;ntico   de textos. <em>Argentine Symposium on Artificial Intelligence (ASAI 2015).</em> Rosario: Sociedad Argentina de Inform&aacute;tica e Investigaci&oacute;n Operativa (SADIO).   Obtenido de http://hdl.handle.net/10915/52169</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> &Aacute;lvarez   Carmona, M. A. (2014). <em>Detecci&oacute;n de similitud sem&aacute;ntica en textos cortos.</em> Instituto Nacional de Astrof&iacute;sica, &Oacute;ptica y Electr&oacute;nica. Puebla, M&eacute;xico:   INAOE. Recuperado el 2018</font><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Am&oacute;n,   I., &amp; Jim&eacute;nez, C. (2010). Funciones de similitud sobre cadenas de texto:   una comparaci&oacute;n basada en la naturaleza de los datos. <em>CONF-IRM Proceedings, 58</em>.    </font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Benesty, M. (Enero de 2018).   fastRtext. <em>R wrapper for fastText C++ code from Facebook</em>. The   Comprehensive R Archive Network. Obtenido de https://CRAN.R-project.org/package=fastrtext</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Bengio, Y., Schwenk, H., &amp;   Senecal, J. (2006). Neural probabilistic language models. <em>Innovations in   Machine Learning</em>, 137&ndash;186.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Bojanowski, P., Grave, E., Joulin,   A., &amp; Mikolov, T. (2017). Enriching Word Vectors with Subword Information.   (H. Schutze, Ed.) <em>Transactions of the Association for Computational   Linguistic, 5</em>, 135&ndash;146.</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Carrasco   G&oacute;mez, P. A. (2017). <em>Uso de representaciones vectoriales de las palabras   para la detecci&oacute;n de dobles sentidos.</em> Valencia: Universidad Polit&eacute;cnica de   Valencia.    </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Cuesta   Santos, A. (2016). Contribuci&oacute;n a la evaluaci&oacute;n del desempe&ntilde;o, el sentido de   compromiso y el accionar de la gesti&oacute;n del capital humano en la empresa. <em>Anales   de la Academia de Ciencias de Cuba, 6</em>(3). Recuperado el 2018, de   http://www.revistaccuba.cu/index.php/acc/article/view/564</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Cuesta   Santos, A. R. (2011). Metodologia de Gestion por Competencias Asumiendo la   Norma Cubana sobre Gestion de Capital Humano. <em>Revista Brasileira de Gest&atilde;o   de Neg&oacute;cios, 13</em>(40), 300. Recuperado el 2018, de http://www.redalyc.org/html/947/94722279005/</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Garc&eacute;s   Hern&aacute;ndez, S. C. (2017). <em>DISE&Ntilde;O DE PROTOCOLO DE PROCEDIMIENTO DE SELECCI&Oacute;N   ORIENTADO EN COMPETENCIAS LABORALES.</em> Bogot&aacute;: UNIVERSIDAD DE CUNDINAMARCA.    </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Gomaa,   W. H., &amp; Fahmy, A. A. (2013). A Survey of Text Similarity Approaches. <em>nternational   Journal of Computer Applications, 68</em>(13).</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Mart&iacute;nez   Garc&iacute;a , Y. (9 de Marzo de 2018). De la inversi&oacute;n extranjera y sus avances. <em>Peri&oacute;dico   Granma</em>. Obtenido de http://www.granma.cu/cuba/2018-03-09/de-la-inversion-extranjera-y-sus-avances-09-03-2018-14-03-02</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Mart&iacute;nez   Hern&aacute;ndez, L., &amp; Puig Meneses, Y. (26 de Marzo de 2018). Analiz&oacute; V Pleno   del Comit&eacute; Central del Partido importantes temas de la actualizaci&oacute;n del   modelo econ&oacute;mico y social. <em>Peri&oacute;dico Granma</em>. Recuperado el Abril de   2018, de   http://www.granma.cu/cuba/2018-03-26/analizo-v-pleno-del-comite-central-del-partido-importantes-temas-de-la-actualizacion-del-modelo-economico-y-social-cubano-26-03-2018-22-03-07</font><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Mikolov, T., Le, Q. v., &amp;   Sutskever, I. (2013). <em>Exploiting Similarities among Languages for Machine   Translation.</em> Santa Clara, California.    </font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Mikolov,   T., Yih, W. T., &amp; Zweig, G. (2013). Linguistic Regularities in Continuous Space Word   Representations. <em>Proceedings of the 2013 Conference of the North American   Chapter of the Association for Computational Linguistics: Human Language   Technologies</em>, (p&aacute;gs. 746-751). Obtenido de arXiv preprint   arXiv:1301.3781.    </font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Mon,   A., Del Giorgio, H., &amp; Querel, M. (2017). Evaluaci&oacute;n de software para el   desarrollo industrial. <em>XIX Workshop de Investigadores en Ciencias de la   Computaci&oacute;n (WICC 2017, ITBA, Buenos Aires)</em> (p&aacute;gs. 805-809). Buenos Aires:   Red de Universidades con Carreras en Inform&aacute;tica (RedUNCI). Recuperado el   2018, de http://sedici.unlp.edu.ar/handle/10915/61343</font><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Rahlf,   T. (2017). <em>Data   Visualisation with R.</em> Nueva York: Springer International Publishing.    </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Slamet, C., Atmadja, A. R.,   Maylawati, D. S., Lestari1, R. S., Darmalaksana, W., &amp; Ramdhani, M. A.   (2018). Automated Text Summarization for Indonesian Article Using Vector Space   Model. <em>The 2nd Annual Applied Science and Engineering Conference (AASEC   2017).</em> <em>345.</em> Pekanbaru-Riau, Indonesia: IOP Publishing.   doi:doi:10.1088/1757-899X/288/1/012037</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Song, W., Zhen Liang, J., Long Cao,   X., &amp; Cheol Park, S. (2014). An effective query recommendation approach   using semantic strategies for intelligent information retrieval. <em>Expert   Systems with Applications, 41</em>(2), 366-372.   doi:https://doi.org/10.1016/j.eswa.2013.07.052.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Sparck Jones, K. (1972). A   statistical interpretation of term specificity and its application in   retrieval. <em>Journal of documentation</em>, 11-21.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Torres   L&oacute;pez, C., &amp; Arco Garc&iacute;a, L. (2016). Representaci&oacute;n textual en espacios   vectoriales sem&aacute;nticos. <em>Revista Cubana de Ciencias Inform&aacute;ticas, 10</em>(2),   148-180.</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Torres   L&oacute;pez, S. (2015). <em>Modelo de evaluaci&oacute;n de competencias a partir de   evidencias durante la gesti&oacute;n de proyectos.</em> Tesis Doctoral, Universidad de   las Ciencias Inform&aacute;ticas, Laboratorio de Investigaciones de Gesti&oacute;n de   Proyectos, La Habana.     Recuperado el 2018</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Torres   L&oacute;pez, S., Aldana Cuza, M. L., Pi&ntilde;ero Perez, P. Y., &amp; Piedra Di&eacute;guez, L.   A. (Noviembre de 2016). Red neuronal multicapa para la evaluaci&oacute;n de   competencias laborales. <em>Revista Cubana de Ciencias Inform&aacute;ticas, 10</em>(Especial   UCIENCIA), 210-223. Recuperado el 2018, de https://rcci.uci.cu/?journal=rcci&amp;page=article&amp;op=view&amp;path%5B%5D=1466</font><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Wang, L., Li, Y., Huang, J., &amp;   Lazebnik, S. (2018). Learning Two-Branch Neural Networks for Image-Text   Matching Tasks. <em>IEEE Transactions on Pattern Analysis and Machine   Intelligence</em>.     doi:10.1109/TPAMI.2018.2797921</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Zimniewicz, M., Kurowski, K., &amp;   W&#281;glarz, J. (2018). Scheduling aspects in keyword extraction problem. <em>International   Transactions in Operational Research</em>, 507&ndash;522.   doi:https://doi.org/10.1111/itor.12368 </font></p>     <p align="justify">&nbsp;</p>     ]]></body>
<body><![CDATA[<p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 27/05/2018    <br> Aceptado: 10/09/2018</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Altszyler]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Brusco]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis de la dinámica del contenido semántico de textos.: Argentine Symposium on Artificial Intelligence]]></source>
<year>(201</year>
<month>5)</month>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Álvarez Carmona]]></surname>
<given-names><![CDATA[M. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Detección de similitud semántica en textos cortos]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Amón]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Jiménez]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Funciones de similitud sobre cadenas de texto: una comparación basada en la naturaleza de los datos]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Benesty]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[fastRtext. R wrapper for fastText C++ code from Facebook.: The Comprehensive R Archive Network.]]></source>
<year>2018</year>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bengio]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Schwenk]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Senecal]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Neural probabilistic language models.: Innovations in Machine Learning]]></source>
<year>2006</year>
<page-range>137-186</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bojanowski]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Grave]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Joulin]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Mikolov]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Enriching Word Vectors with Subword Information. (H. Schutze, Ed.): Transactions of the Association for Computational Linguistic]]></source>
<year>2017</year>
<page-range>135-146</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carrasco Gómez]]></surname>
<given-names><![CDATA[P. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Uso de representaciones vectoriales de las palabras para la detección de dobles sentidos]]></source>
<year>2017</year>
<publisher-loc><![CDATA[Valencia ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cuesta Santos]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Contribución a la evaluación del desempeño, el sentido de compromiso y el accionar de la gestión del capital humano en la empresa.]]></source>
<year>2016</year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cuesta Santos]]></surname>
<given-names><![CDATA[A. R]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Metodologia de Gestion por Competencias Asumiendo la Norma Cubana sobre Gestion de Capital Humano.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>13</volume>
<numero>40</numero>
<issue>40</issue>
<page-range>300</page-range><publisher-name><![CDATA[Revista Brasileira de Gestão de Negócios]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Garcés Hernández]]></surname>
<given-names><![CDATA[S. C]]></given-names>
</name>
</person-group>
<source><![CDATA[DISEÑO DE PROTOCOLO DE PROCEDIMIENTO DE SELECCIÓN ORIENTADO EN COMPETENCIAS LABORALES.]]></source>
<year>2017</year>
<publisher-loc><![CDATA[Bogotá ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gomaa]]></surname>
<given-names><![CDATA[W. H]]></given-names>
</name>
<name>
<surname><![CDATA[Fahmy]]></surname>
<given-names><![CDATA[A. A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Survey of Text Similarity Approaches International Journal of Computer Applications]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>68</volume>
<numero>13</numero>
<issue>13</issue>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martínez García]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[De la inversión extranjera y sus avances.]]></source>
<year>2018</year>
<publisher-name><![CDATA[Periódico Granma]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martínez Hernández]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Puig Meneses]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Analizó V Pleno del Comité Central del Partido importantes temas de la actualización del modelo económico y social.]]></source>
<year>2018</year>
<publisher-name><![CDATA[Periódico Granma]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mikolov]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Le]]></surname>
<given-names><![CDATA[Q. v]]></given-names>
</name>
<name>
<surname><![CDATA[Sutskever]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<source><![CDATA[Exploiting Similarities among Languages for Machine Translation]]></source>
<year>2013</year>
<publisher-loc><![CDATA[Santa ClaraCalifornia ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mikolov]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Yih]]></surname>
<given-names><![CDATA[W. T.]]></given-names>
</name>
<name>
<surname><![CDATA[Zweig]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Linguistic Regularities in Continuous Space Word Representations.: Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies]]></source>
<year>2013</year>
<page-range>746-751</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mon]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Del Giorgio]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Querel]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluación de software para el desarrollo industrial.]]></source>
<year>2017</year>
<page-range>805-809</page-range><publisher-loc><![CDATA[, Buenos Aires ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rahlf]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Visualisation with R]]></source>
<year>2017</year>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Slamet]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Atmadja]]></surname>
<given-names><![CDATA[A. R]]></given-names>
</name>
<name>
<surname><![CDATA[Darmalaksana]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Ramdhani]]></surname>
<given-names><![CDATA[M. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Automated Text Summarization for Indonesian Article Using Vector Space Model.: The 2nd Annual Applied Science and Engineering Conference (AASEC 2017)]]></source>
<year>2018</year>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Song]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Zhen Liang]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Long Cao]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Cheol Park]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An effective query recommendation approach using semantic strategies for intelligent information retrieval.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>41</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>366-372</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sparck]]></surname>
<given-names><![CDATA[Jones]]></given-names>
</name>
</person-group>
<source><![CDATA[A statistical interpretation of term specificity and its application in retrieval.]]></source>
<year>1972</year>
<page-range>11-21</page-range><publisher-name><![CDATA[Journal]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Torres López]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Arco García]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Representación textual en espacios vectoriales semánticos]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>10</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>148-180</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Torres López]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Modelo de evaluación de competencias a partir de evidencias durante la gestión de proyectos]]></source>
<year>2015</year>
<publisher-loc><![CDATA[La Habana ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Torres López]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Aldana Cuza]]></surname>
<given-names><![CDATA[M. L]]></given-names>
</name>
<name>
<surname><![CDATA[Piñero Perez]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
<name>
<surname><![CDATA[Piedra Diéguez]]></surname>
<given-names><![CDATA[L. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Red neuronal multicapa para la evaluación de competencias laborales.]]></source>
<year>2016</year>
<page-range>210-223</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Lazebnik]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Learning Two-Branch Neural Networks for Image-Text Matching Tasks.: IEEE Transactions on Pattern Analysis and Machine Intelligence.]]></source>
<year>2018</year>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zimniewicz]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Kurowski]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[W&#281;glarz]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Scheduling aspects in keyword extraction problem.: International Transactions in Operational Research]]></source>
<year>2018</year>
<page-range>507-522</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
