<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1684-1859</journal-id>
<journal-title><![CDATA[Revista Cubana de Informática Médica]]></journal-title>
<abbrev-journal-title><![CDATA[RCIM]]></abbrev-journal-title>
<issn>1684-1859</issn>
<publisher>
<publisher-name><![CDATA[Universidad de Ciencias Médicas de La Habana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1684-18592016000300002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Similitud molecular empleando Índices Híbridos]]></article-title>
<article-title xml:lang="en"><![CDATA[Molecular similarity using Hybrid Indices]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Antelo-Collado]]></surname>
<given-names><![CDATA[Aurelio]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Paneque-Pérez]]></surname>
<given-names><![CDATA[Juan L]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Hernández-Govea]]></surname>
<given-names><![CDATA[María C]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Carrasco-Velar]]></surname>
<given-names><![CDATA[Ramón]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>00</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>00</month>
<year>2016</year>
</pub-date>
<volume>8</volume>
<fpage>487</fpage>
<lpage>498</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S1684-18592016000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S1684-18592016000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S1684-18592016000300002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Se presenta un método para la detección de semejanza entre moléculas basado en macheo inexacto de grafos. Se parte del grafo molecular completo ponderado en sus vértices por propiedades químico-físicas particionadas sobre los mismos, se reduce el grafo por el procedimiento CALEDE que define Centros Descriptores o fragmentos de primer orden, los cuales son subgrafos ponderados por la suma de los valores de los vértices ponderados individualmente a su vez, y se construyen fragmentos denominados de segundo orden que incluyen la distancia entre los centros de masas de ambos centros descriptores. Se presenta el método de búsqueda aplicado a una base de datos de más de 300 moléculas con sus respectivas estructuras en tres dimensiones. Esos compuestos se encuentran evaluados como anticancerígenos en la base de datos de compuestos del NCBI-USA. En el experimento computacional se encuentra que, en dependencia de la función de similitud empleada, es posible detectar compuestos que a pesar de poseer diferente topología, poseen valores de las propiedades empleadas para el macheo lo cual sugiere la presencia de potenciales farmacóforos como hallazgo relevante, lo cual constituiría un novedoso enfoque para el diseño computacional de fármacos.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[A method for detecting similarity between molecules based on inexact matching graph is presented. We start from a complete molecular graph vertices weighted by several hybrid indices. The molecular graph is reduced by CALEDE procedure, which define descriptors centers or first order fragments. These fragments are subgraphs weighted with the sum of values of the vertices weighted with the hybrid indices. It also define second order fragments by including the distance between the centers of mass of both descriptors centers. The search method applied to a database of over 300 molecules with their respective threedimensional structures is presented. These compounds are reported in the NCBI-USA database of compounds whish were evaluated in anticancer tests. In the computational experiment, depending on the similarity function used, is possible to detect compounds that despite having different topology have property values suggesting the presence of potential pharmacophore. It suggest the possibility to use this approach as a novel approach for computational drug design.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[similitud molecular]]></kwd>
<kwd lng="es"><![CDATA[índices híbridos]]></kwd>
<kwd lng="es"><![CDATA[CALEDE]]></kwd>
<kwd lng="en"><![CDATA[molecular similarity]]></kwd>
<kwd lng="en"><![CDATA[hybrid índices]]></kwd>
<kwd lng="en"><![CDATA[CALEDE]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><strong><font size="2" face="Verdana"><b>ART&Iacute;CULO ORIGINAL</b></font></strong></p>     <p align="right">&nbsp;</p>     <p align="left"><strong><font size="4" face="Verdana">Similitud molecular empleando    &Iacute;ndices H&iacute;bridos </font></strong></p>     <p align="left">&nbsp;</p>     <p align="left"><font size="3" face="Verdana"><strong>Molecular similarity using    Hybrid Indices</strong></font> </p>     <p align="left">&nbsp;</p>     <p align="left">&nbsp;</p>     <p align="left"><font face="Verdana"></font><strong><font size="2" face="Verdana">Aurelio    Antelo-Collado,<sup>I</sup> Juan L. Paneque-P&eacute;rez,<sup>II</sup> Mar&iacute;a    C. Hern&aacute;ndez-Govea,<sup>III</sup> Ram&oacute;n Carrasco-Velar<sup>IV</sup></font>    </strong> </p> <font face="Verdana">      <P><font face="Verdana"><font face="Verdana"><font size="2">I</font></font></font>    <font size="2" face="Verdana">Universidad de las Ciencias Inform&aacute;ticas,    Carretera a San Antonio de los Ba&ntilde;os km 2&#189;, La Habana, Cuba. </font><font face="Verdana"><font size="2">E-mail:</font></font>    <font size="2" face="Verdana"><a href="mailto:aantelo@uci.cu">aantelo@uci.cu</a>    <br>   II    Universidad de las Ciencias Inform&aacute;ticas, La Habana, Cuba.    E-mail: <a href="mailto:jlpaneque@uci.cu">jlpaneque@uci.cu</a>    ]]></body>
<body><![CDATA[<br>   </font><font face="Verdana"><font size="2">III</font></font><font size="2" face="Verdana">    Universidad de las Ciencias Inform&aacute;ticas, La Habana, Cuba.    E-mail: <a href="mailto:mcgovea@uci.cu">mcgovea@uci.cu</a>    <br>   IV</font> <font size="2" face="Verdana">Universidad    de las Ciencias Inform&aacute;ticas, La Habana, Cuba. E-mail:    <a href="mailto:rcarrasco@uci.cu">rcarrasco@uci.cu</a> </font></font> <hr> <font size="2" face="Verdana"><strong>RESUMEN</strong></font>      <P><font size="2" face="Verdana">Se presenta un m&eacute;todo para la detecci&oacute;n    de semejanza entre mol&eacute;culas basado en macheo inexacto de grafos. Se    parte del grafo molecular completo ponderado en sus v&eacute;rtices por propiedades    qu&iacute;mico-f&iacute;sicas particionadas sobre los mismos, se reduce el grafo    por el procedimiento CALEDE que define Centros Descriptores o fragmentos de    primer orden, los cuales son subgrafos ponderados por la suma de los valores    de los v&eacute;rtices ponderados individualmente a su vez, y se construyen    fragmentos denominados de segundo orden que incluyen la distancia entre los    centros de masas de ambos centros descriptores. Se presenta el m&eacute;todo    de b&uacute;squeda aplicado a una base de datos de m&aacute;s de 300 mol&eacute;culas    con sus respectivas estructuras en tres dimensiones. Esos compuestos se encuentran    evaluados como anticancer&iacute;genos en la base de datos de compuestos del    NCBI-USA. En el experimento computacional se encuentra que, en dependencia de    la funci&oacute;n de similitud empleada, es posible detectar compuestos que    a pesar de poseer diferente topolog&iacute;a, poseen valores de las propiedades    empleadas para el macheo lo cual sugiere la presencia de potenciales farmac&oacute;foros    como hallazgo relevante, lo cual constituir&iacute;a un novedoso enfoque para    el dise&ntilde;o computacional de f&aacute;rmacos. </font>      <P><font size="2" face="Verdana"><strong>Palabras Clave:</strong> similitud molecular,    &iacute;ndices h&iacute;bridos, CALEDE.</font> <hr> <font size="2" face="Verdana"><strong>ABSTRACT</strong></font>      <p><font size="2" face="Verdana">A method for detecting similarity between molecules    based on inexact matching graph is presented. We start from a complete molecular    graph vertices weighted by several hybrid indices. The molecular graph is reduced    by CALEDE procedure, which define descriptors centers or first order fragments.    These fragments are subgraphs weighted with the sum of values of the vertices    weighted with the hybrid indices. It also define second order fragments by including    the distance between the centers of mass of both descriptors centers. The search    method applied to a database of over 300 molecules with their respective threedimensional    structures is presented. These compounds are reported in the NCBI-USA database    of compounds whish were evaluated in anticancer tests. In the computational    experiment, depending on the similarity function used, is possible to detect    compounds that despite having different topology have property values suggesting    the presence of potential pharmacophore. It suggest the possibility to use this    approach as a novel approach for computational drug design. </font> </p>     <P><strong><font size="2" face="Verdana">KeyWords</font></strong><font size="2" face="Verdana">:    molecular similarity, hybrid &iacute;ndices, CALEDE. </font> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><strong><font size="3" face="Verdana"> INTRODUCCI&Oacute;N </font> </strong></p>     <P><font size="2" face="Verdana">Se ha demostrado que los &iacute;ndices h&iacute;bridos<sup>1</sup>   propuestos por Carrasco y cols. para la descripci&oacute;n simult&aacute;nea    de propiedades qu&iacute;mico-f&iacute;sicas y la estructura qu&iacute;mica    permiten describir y representar una mol&eacute;cula o fragmento de ella de    tres formas diferentes utilizando un procedimiento computacional y matem&aacute;ticamente    sencillo. Permite tambi&eacute;n comparar estructuras diferentes a partir de    la utilizaci&oacute;n de dichos &iacute;ndices, lo cual ha abierto ha abierto    una nueva puerta para el trabajo de b&uacute;squedas intensas en bases de datos.    </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">En las bases de datos de mol&eacute;culas org&aacute;nicas    es posible encontrar grandes diferencias estructurales. Cuando el objeto de    la base es el almacenamiento de mol&eacute;culas biol&oacute;gicamente activas,    se encuentra entonces que la elevada diferencia estructural entre los compuestos    revela dos diferentes paradojas estructurales; compuestos estructuralmente semejantes    presentan actividades distintas, o compuestos estructuralmente diferentes presentan    similar actividad. Con los nuevos descriptores h&iacute;bridos se pretende contribuir    a la resoluci&oacute;n de este problema. </font>      <P><font size="2" face="Verdana">Son m&uacute;ltiples y diferentes los m&eacute;todos    para la realizaci&oacute;n de b&uacute;squedas en bases de datos de estructuras    qu&iacute;micas. La utilizaci&oacute;n de medidas de semejanza o similitud entre    grafos (macheo exacto de grafos), es uno de los procedimientos m&aacute;s empleados    hist&oacute;ricamente en esta &aacute;rea de la qu&iacute;mica grafo te&oacute;rica.    En el presente trabajo se presentan los procedimientos desarrollados para el    establecimiento de los criterios de similitud diferencia entre fragmentos o    mol&eacute;culas utilizando los &iacute;ndices h&iacute;bridos, en un macheo    inexacto de grafos. </font>      <P><strong><font size="2" face="Verdana"> SOFTWARE Y PROCEDIMIENTOS </font> </strong>     <P><font size="2" face="Verdana"> <strong>Datos</strong></font>      <P><font size="2" face="Verdana">El conjunto de datos de trabajo es el ensayo    AID941 del NCBI.<sup>2</sup> Est&aacute; formado por un conjunto de 330 mol&eacute;culas.    El formato de fichero de datos estructurales utilizado de las mol&eacute;culas    fue el *.mol o *.sdf. Las estructuras qu&iacute;micas se visualizan empleando    el Jmol, visualizador de Java de c&oacute;digo abierto que realiza la representaci&oacute;n    gr&aacute;fica tridimensional de alto rendimiento sin requerimientos de hardware,    ya que solo precisa de la instalaci&oacute;n de la M&aacute;quina Virtual de    Java. </font>      <P><strong><font size="2" face="Verdana"> Descriptores topogr&aacute;ficos</font>    </strong>     <P><font size="2" face="Verdana">Como descriptores topogr&aacute;ficos a utilizar    se emplearon los &iacute;ndices de Estado Refracto, Electro y Lipotopogr&aacute;fi-cos    para &Aacute;tomos desarrollados por Carrasco y cols.<sup>1</sup> Para el c&aacute;lculo    de estos &iacute;ndices se utiliz&oacute; la librer&iacute;a Chemistry Development    Kit (CDK),<sup>3</sup> una librer&iacute;a de c&oacute;digo abierto programada    en Java que est&aacute; destinada para la realizaci&oacute;n de c&aacute;lculos    en qu&iacute;mica computacional, la quimio y la bioinform&aacute;tica. La reducci&oacute;n    del grafo molecular se realiz&oacute; con el algoritmo CALEDE,<sup>4</sup> definido    por Carrasco y cols. e implementado en la librer&iacute;a CDK. Mediante CALEDE    se generan fragmentos moleculares de segundo orden definidos como dos Centros    Descriptores (CD) m&aacute;s la distancia euclidiana entre los centros de masas    de los respectivos CD. Los Centros Descriptores de CALEDE (fragmentos de primer    orden) son agrupaciones t&iacute;picas de grafos como ciclos o anillos, estrellas    de orden 3 y 4, los hal&oacute;genos, ox&iacute;geno, nitr&oacute;geno y los    grupos metilo, metileno y metino. </font>      <P><strong><font size="2" face="Verdana"> Funciones de similitud</font> </strong>     <P><font size="2" face="Verdana">Como funciones de similitud se emplearon las    de S&oslash;rensen, Dice-S&oslash;rensen, Tanimoto, Jaccard, Ruzicka, Cze-kanowski    y Soergel, incluidas en la revisi&oacute;n de Sung<sup>5</sup> por considerarse    que son las que mejor se adaptan al c&aacute;lculo de similitud molecular, basados    en vectores de valores. </font>     <P>&nbsp;     ]]></body>
<body><![CDATA[<P><font size="3" face="Verdana"><strong>RESULTADOS Y DISCUSI&Oacute;N</strong></font>      <P><strong><font size="2" face="Verdana"> C&aacute;lculo de los umbrales de similitud    a utilizar</font> </strong>     <P><font size="2" face="Verdana">Un elemento a tener presente cuando se realizan    c&aacute;lculos de semejanza mediante el empleo de funciones de similitud, lo    constituye el grado de error permisible que se utilizar&aacute;. Es por ello,    que antes de realizar las pruebas para validar los algoritmos implementados,    se hace indispensable determinar el umbral de m&aacute;xima diferencia o valor    de m&iacute;nima similitud de cada una de las funciones seleccionadas, el cual    se estar&aacute; empleando en las b&uacute;squedas que se realizar&aacute;n    y constituir&aacute;n las propuestas a umbrales de esta investigaci&oacute;n,    aunque el criterio de determinaci&oacute;n puede cambiar, por lo que queda a    decisi&oacute;n del investigador establecer el umbral que desee para sus experimentos.    Para determinar los umbrales se escogieron arbitrariamente once fragmentos moleculares    de segundo orden, pertenecientes a mol&eacute;culas presentes en el ensayo AID941<sup>6</sup>,    con los cuales se realizaron b&uacute;squedas para ajustar los l&iacute;mites    deseados, cada uno de los fragmentos seleccionados se examinaron con los fragmentos    presentes en cada una de las 330 mol&eacute;culas contenidas en el propio ensayo    AID941. En los experimentos realizados se considera un resultado correcto cuando    los fragmentos obtenidos pertenecen al mismo tipo de fragmento seleccionado    e incorrecto en caso contrario. </font>      <P><font size="2" face="Verdana">En la <a href="/img/revistas/rcim/v8s1/t0102316.gif">tabla    1</a> se muestra el procedimiento realizado para el coeficiente de Tanimoto.    Inicialmente se realiza la b&uacute;squeda para el fragmento compuesto por un    anillo y un hetero&aacute;tomo de ox&iacute;geno, tomando un umbral lo suficientemente    amplio, para que se obtuvieran resultados correctos e incorrectos, obteni&eacute;ndose    76 fragmentos del mismo tipo del fragmento seleccionado y 1 de otro tipo (con    un valor de 0.1996 de diferencia), por lo que es necesario disminuir el umbral    hasta 0.199. Con este nuevo umbral, se realiza una nueva b&uacute;squeda, tomando    un fragmento compuesto por un anillo y un hetero&aacute;tomo de nitr&oacute;geno,    obteni&eacute;ndose 33 bien y 69 mal (con valores entre 0.0911 y 0.1987 de diferencia),    por lo que se hace necesario un nuevo ajuste del umbral de forma tal que sea    menor que el menor valor de diferencia obtenido dentro de los resultados incorrectos,    fij&aacute;ndose el nuevo umbral hasta 0.091. A continuaci&oacute;n, y con este    nuevo valor, se realiza nuevamente la b&uacute;squeda, pero con un fragmento    compuesto por un anillo y un hetero&aacute;tomo de cloro, encontr&aacute;ndose    2 fragmentos correctos, por lo que no es necesario disminuir el umbral. Este    procedimiento se realiza para cada uno de los 7 restantes fragmentos, modificando    el valor si se encuentran resultados incorrectos y manteni&eacute;ndolo igual    en otro caso. </font>      <P><font size="2" face="Verdana">El m&eacute;todo descrito anteriormente se realiz&oacute;    para cada una de las funciones de similitud y de distancia seleccionadas para    esta investigaci&oacute;n, tomando como base los fragmentos seleccionados. Cabe    destacar que en el caso de las funciones de similitud el ajuste de umbral se    realiz&oacute; tomando un valor mayor que el mayor valor de similitud obtenido    dentro de los resultados incorrectos y en el caso de las funciones de distancia,    como se explic&oacute; anteriormente en el caso del coeficiente de Tanimoto.    En las tablas <a href="#t02">2</a>-<a href="#t03">3</a>- <a href="#t04">4</a>-<a href="#t05">5</a>-<a href="#t06">6</a>-<a href="/img/revistas/rcim/v8s1/t0702316.gif">7</a>    se muestran los valores obtenidos en los experimentos realizados. </font>      <P align="center"><img src="/img/revistas/rcim/v8s1/t0202316.gif" width="506" height="269"> <a name="t02"></a>     <P align="center"><img src="/img/revistas/rcim/v8s1/t0302316.gif" width="498" height="265"><a name="t03"></a>     <P align="center"><img src="/img/revistas/rcim/v8s1/t0402316.gif" width="537" height="277"> <a name="t04"></a>     <P align="center"><img src="/img/revistas/rcim/v8s1/t0502316.gif" width="560" height="288"> <a name="t05"></a>     <P align="center"><img src="/img/revistas/rcim/v8s1/t0602316.gif" width="506" height="271"> <a name="t06"></a>     ]]></body>
<body><![CDATA[<P>      <P><font size="2" face="Verdana">En la <a href="#t08">tabla 8</a> se presenta    el resumen de los umbrales para cada una de las 7 funciones de similitud/distancia    seleccionadas para esta investigaci&oacute;n. </font>     <P align="center"><img src="/img/revistas/rcim/v8s1/t0802316.gif" width="485" height="228"> <a name="t08"></a>     <P><font size="2" face="Verdana">Es necesario aclarar que los valores de umbral    calculados, fueron obtenidos a partir del algoritmo de b&uacute;squeda de fragmentos    simples implementado y teniendo en cuenta las tres propiedades qu&iacute;mico-f&iacute;sicas    para cada uno de los fragmentos analizados, estos valores pueden cambiar para    las b&uacute;squedas en las que solo se tenga en cuenta uno de las propiedades.</font>     <P><font size="2" face="Verdana"> <strong>Utilizaci&oacute;n de la fragmentaci&oacute;n    y los &iacute;ndices h&iacute;bridos</strong></font>      <P><font size="2" face="Verdana">No todas las mol&eacute;culas cumplen el principio    de Johnson y Maggiora<sup>4</sup> de que compuestos estructuralmente semejantes    exhiben propiedades semejantes. Como contradicci&oacute;n a este postulado existen    las paradojas estructurales, expresadas en que mol&eacute;culas similares estructuralmente    tienden a exhibir propiedades biol&oacute;gicas diferentes y mol&eacute;culas    diferentes estructuralmente tienden a exhibir propiedades biol&oacute;gicas    similares. Por lo antes planteado, el cotejo exacto de grafos no constituye    una elecci&oacute;n a la hora de realizar b&uacute;squedas de similitud molecular.    La necesidad de realizar comparaciones entre mol&eacute;culas y encontrar un    m&eacute;todo para determinar similitud molecular, nos condujo al empleo de    descriptores h&iacute;bridos ponderados por propiedades qu&iacute;mico-f&iacute;sicas,    espec&iacute;ficamente el &iacute;ndice de estado Refractotopogr&aacute;fico    para &aacute;tomos, el &iacute;ndice de estado Electrotopogr&aacute;fico para    &aacute;tomos y el &iacute;ndice de estado Lipotopogr&aacute;fico para &aacute;tomos,    los cuales reportados anteriormente. </font>      <P><font size="2" face="Verdana">En la <a href="/img/revistas/rcim/v8s1/f0102316.jpg">figura 1</a> se muestra    el comportamiento del valor del &iacute;ndice del estado refractotopol&oacute;gico.    Puede verse la diferencia de valor del &iacute;ndice, dada la diferente distribuci&oacute;n    espacial de estos compuestos, los cuales son considerados is&oacute;meros de    posici&oacute;n por su diferente distribuci&oacute;n en la estructura. Obs&eacute;rvese    como los &aacute;tomos externos var&iacute;an su valor de una estructura a la    otra y como disminuye apreciablemente el valor del &aacute;tomo situado geom&eacute;tricamente    al centro. Esta variaci&oacute;n est&aacute; dada por la influencia que ejercen    el resto de los &aacute;tomos sobre los restantes de la mol&eacute;cula. </font>      <P><font size="2" face="Verdana">Otro ejemplo que ilustra lo planteado anteriormente    lo constituyen los fragmentos mostrados en la <a href="/img/revistas/rcim/v8s1/f0202316.jpg">figura 2</a>,    donde se muestra que los valores del &Iacute;ndice del Estado Refractotopogr&aacute;fico    de los &aacute;tomos que conforman a los fragmentos moleculares var&iacute;an    al cambiar uno de los &aacute;tomos presentes en los mismos, evidenci&aacute;ndose    que el &iacute;ndice revela el comportamiento de las propiedades qu&iacute;mico-f&iacute;sicas    y c&oacute;mo esta var&iacute;a, no solo en dependencia del tipo de &aacute;tomo    y de la estructura que presenten los fragmentos, sino del efecto que ejercen    los &aacute;tomos vecinos. Este hecho sugiere el empleo de los &iacute;ndices    para estudios de similitud molecular. </font>      <P><font size="2" face="Verdana">En la <a href="#f03">figura 3</a> se muestran    fragmentos estructuralmente iguales, que difieren debido a la existencia de    diferen-tes &aacute;tomos pesados (F, Cl, Br, I), cuyos valores del &iacute;ndice    del estado refractopogr&aacute;fico son distintos, y la in-fluencia de cada    uno de estos sobre el resto provoca que estos presenten valores diferentes en    sus propieda-des, consecuentemente presentan actividad biol&oacute;gica diferente.    Por lo antes planteado el empleo de los &iacute;ndices de Carrasco y cols. constituye    uno de los ejes de esta investigaci&oacute;n. </font>      <P align="center"><img src="/img/revistas/rcim/v8s1/f0302316.jpg" width="406" height="157"> <a name="f03"></a>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Otro elemento fundamental lo constituye la fragmentaci&oacute;n    molecular utilizando los centros descriptores de CA-LEDE. Como se aprecia en    la <a href="/img/revistas/rcim/v8s1/t0902316.gif">tabla 9</a>, los subgrafos mostrados son topol&oacute;gicamente    id&eacute;nticos y se han definido como fragmentos de segundo orden al estar    formados por un anillo y un hetero&aacute;tomo, excepto el cuarto que est&aacute;    formado por un anillo y un metilo. </font>      <P><font size="2" face="Verdana">Debe acotarse que las propiedades qu&iacute;micas    de un grupo metilo difieren apreciablemente a las de un hetero&aacute;tomo,    aunque sea comparable en cuanto a tama&ntilde;o con respecto al bromo o el iodo.    </font>      <P><font size="2" face="Verdana">Otro de los criterios que permite validar la    utilizaci&oacute;n de la fragmentaci&oacute;n propuesta, en los estudios de    similitud molecular se evidencia en la <a href="#t10">tabla 10</a>. </font>      <P align="center"><font size="2" face="Verdana"><img src="/img/revistas/rcim/v8s1/t1002316.gif" width="526" height="229"><a name="t10"></a>    </font>     <P><font size="2" face="Verdana">En la misma se muestra la realizaci&oacute;n    de cuatro b&uacute;squedas tomando varios fragmentos que estructuralmente son    id&eacute;nticos, pero como se evidencia las propiedades qu&iacute;mico-f&iacute;sicas    de cada uno de ellos son diferentes, este cambio se debe fundamentalmente a    la posici&oacute;n espacial con respecto al resto de los &aacute;tomos que conforman    a las mol&eacute;culas a las cuales pertenecen, debido a que en algunas el fragmento    se encuentra en un extremo y en otros casos se encuentra al centro, por lo que    la influencia sobre el fragmento especifico varia en los diferentes casos. </font>      <P><font size="2" face="Verdana">En la tabla se muestra la cantidad de resultados    encontrados para cada una de las posiciones, seg&uacute;n se muestra en la mol&eacute;cula    en la parte inferior de la tabla. </font>      <P><font size="2" face="Verdana">Los criterios planteados anteriormente sugieren    que para realizar estudios de similitud molecular no se debe tener en cuenta    solamente m&eacute;todos que trabajen a partir de la estructura de las mol&eacute;culas,    sino que es razonablemente aconsejable, explorar alternativas como la propuesta    en este trabajo, mediante el empleo de una forma de fragmentaci&oacute;n de    las mol&eacute;culas, que aporte informaci&oacute;n no solo estructural, sino    adem&aacute;s de propiedades asociadas a esas estructuras como la que brindan    el algoritmo CALEDE de fragmentaci&oacute;n y los descriptores h&iacute;bridos    </font>      <P><font size="2" face="Verdana">ponderados con propiedades qu&iacute;mico f&iacute;sicas    particionadas sobre los v&eacute;rtices del grafo molecular. </font>      <P><font size="2" face="Verdana"><strong>B&uacute;squedas de fragmentos simples</strong>    </font>     <P><font size="2" face="Verdana">Los fragmentos de segundo orden son, como se    explic&oacute; anteriormente, los subgrafos del grafo reducido de CALEDE que    est&aacute;n formados por dos Centros Descriptores. A partir de estos fragmentos    se forma un vector formado por los valores de los &iacute;ndices Electrotopogr&aacute;fico,    Refractotopogr&aacute;fico y Lipotopogr&aacute;fico de cada Centro Descriptor    y la distancia entre los centros de masas de cada uno de ellos. Esta representaci&oacute;n    en vectores de n&uacute;meros reales, permite la aplicaci&oacute;n de funciones    matem&aacute;ticas, que determinen la semejanza entre ellos. </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">En la <a href="/img/revistas/rcim/v8s1/t1102316.gif">tabla 11</a> se muestra    el fragmento A6-HCl1 perteneciente a la mol&eacute;cula 12005721 del ensayo    AID941, en la misma aparecen los valores de los y la distancia entre los centros    descriptores que lo forman. </font>      <P><font size="2" face="Verdana">Tomando como objetivo el fragmento mostrado en    la <a href="/img/revistas/rcim/v8s1/t1102316.gif">tabla 11</a>, se realizaron varias ejecuciones del algoritmo    implementado para la b&uacute;squeda de fragmentos similares aplicando cada    una de las funciones de similitud seleccionadas. En la <a href="/img/revistas/rcim/v8s1/t1202316.gif">tabla    12</a> se muestran los fragmentos en com&uacute;n que fueron encontrados por    cada una de las funciones de similitud. </font>      <P><font size="2" face="Verdana">A partir del an&aacute;lisis de los resultados,    se evidencia que el algoritmo implementado permite encontrar aquellos fragmentos    dentro del ensayo que poseen gran semejanza en los valores de los &iacute;ndices    con el fragmento objetivo y a la vez presentan una notable semejanza estructural.    </font>      <P><font size="2" face="Verdana">En la <a href="/img/revistas/rcim/v8s1/f0402316.jpg">figura 4</a>    se muestra la cantidad de resultados devueltos por el algoritmo, por cada una    de las funciones de similitud seleccionadas.</font>      <P><font size="2" face="Verdana">De las nueve funciones de similitud evaluadas,    solo Jaccard y DiceSorensen devuelven un menor n&uacute;mero de fragmentos.    El procedimiento aqu&iacute; presentado introduce el enfoque del macheo inexacto    de grafos moleculares para grafos ponderados por propiedades quimico-f&iacute;sicas    particionadas, lo cual puede resultar una nueva v&iacute;a de aproximaci&oacute;n    a la detecci&oacute;n de regiones de mol&eacute;culas involucradas directamente    en la respuesta biol&oacute;gica, determinado por algunas propiedades qu&iacute;mico-f&iacute;sicas,    con lo cual se abrir&iacute;a una nueva opci&oacute;n para el dise&ntilde;o    computacional de f&aacute;rmacos. </font>      <P>&nbsp;      <P><font size="2" face="Verdana"><strong>CONCLUSIONES</strong> </font>      <P><font size="2" face="Verdana">Se desarroll&oacute; un procedimiento de b&uacute;squeda    de fragmentos moleculares basado en el m&eacute;todo CALEDE de fragmentaci&oacute;n    de mol&eacute;culas ponderadas por los &iacute;ndices topogr&aacute;ficos h&iacute;bridos    de Carrasco et.al. y el principio del macheo inexacto de grafos. El empleo de    diferentes funciones de similitud mostr&oacute; la factibilidad del m&eacute;todo    empleado para extraer informaci&oacute;n de diferente naturaleza de bases de    datos de estructuras qu&iacute;micas. </font>      <P>&nbsp;      <P><font size="2" face="Verdana"><strong>AGRADECIMIENTOS</strong> </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Los autores, agradecen las facilidades brindadas    por la Universidad de Ciencias Inform&aacute;ticas para la realizaci&oacute;n    de este trabajo.</font>      <P>&nbsp;      <P><font size="2" face="Verdana"><strong>REFERENCIAS BIBLIOGR&Aacute;FICAS </strong></font>      <!-- ref --><P><font size="2" face="Verdana">1. Carrasco-Velar R, Prieto-Entenza J.O, Antelo-Collado    A, Padr&oacute;n-Garc&iacute;a J.A, Cerruela-Garc&iacute;a G, Maceo-Pixa &Aacute;.L,    Alcolea-N&uacute;&ntilde;ez R, Silva-Rojas L.G. (2013). Hybrid reduced graph    for SAR studies, SAR and QSAR in Environmental Research. DOI:10.1080/1062936X.2013.764926.        </font>      <!-- ref --><P><font size="2" face="Verdana">2. NCBI. PubChem BioAssay Database AID941. Disponible    en: <a href="http://www.ncbi.nlm.nih.gov/pcassay" target="_blank">http://www.ncbi.nlm.nih.gov/pcassay</a>    </font>      <!-- ref --><P><font size="2" face="Verdana">3. Steinbeck Christoph Han, Yongquan Kuhn S,    Horlacher O, Luttmann E, Willighagen E. The Chemistry Development Kit (CDK):    an open source Java library for Chemo and Bioinformatics. J. Chem. Inf. Comput.    Sci. 2003. </font> <font size="2" face="Verdana">43 (2), pp 493-500.    </font>     <!-- ref --><P><font size="2" face="Verdana">4. Carrasco-Velar R, Trinchet-Almaguer D, Ortiz-Tornin    S, P&eacute;rez-Dur&aacute;n R.E. CALEDE Lenguaje descriptor de la estructura    qu&iacute;mica. QUITEL XXXIII.    </font>      ]]></body>
<body><![CDATA[<!-- ref --><P><font size="2" face="Verdana">5. Sung Hyuk, Cha. Comprehensive Survey on Distance/Similarity    Measures between Probability Density Functions, 2007.     </font>      <P>&nbsp;      <P>&nbsp;      <P><font size="2" face="Verdana">Recibido: 22 de marzo de 2016.    <br>   Aprobado: 12 de mayo de 2016.</font>       ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carrasco-Velar]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Prieto-Entenza]]></surname>
<given-names><![CDATA[J.O]]></given-names>
</name>
<name>
<surname><![CDATA[Antelo-Collado]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Padrón-García]]></surname>
<given-names><![CDATA[J.A]]></given-names>
</name>
<name>
<surname><![CDATA[Cerruela-García]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Maceo-Pixa]]></surname>
<given-names><![CDATA[Á.L]]></given-names>
</name>
<name>
<surname><![CDATA[Alcolea-Núñez]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Silva-Rojas]]></surname>
<given-names><![CDATA[L.G]]></given-names>
</name>
</person-group>
<source><![CDATA[Hybrid reduced graph for SAR studies, SAR and QSAR in Environmental Research]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<collab>NCBI</collab>
<source><![CDATA[PubChem BioAssay Database AID941]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Steinbeck Christoph]]></surname>
<given-names><![CDATA[Han]]></given-names>
</name>
<name>
<surname><![CDATA[Yongquan Kuhn]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Horlacher]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
<name>
<surname><![CDATA[Luttmann]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Willighagen]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Chemistry Development Kit (CDK): an open source Java library for Chemo and Bioinformatics]]></article-title>
<source><![CDATA[J. Chem. Inf. Comput. Sci]]></source>
<year>2003</year>
<volume>43</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>493-500</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carrasco-Velar]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Trinchet-Almaguer]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Ortiz-Tornin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Pérez-Durán]]></surname>
<given-names><![CDATA[R.E]]></given-names>
</name>
</person-group>
<source><![CDATA[CALEDE Lenguaje descriptor de la estructura química]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sung Hyuk]]></surname>
<given-names><![CDATA[Cha]]></given-names>
</name>
</person-group>
<source><![CDATA[Comprehensive Survey on Distance/Similarity Measures between Probability Density Functions]]></source>
<year>2007</year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
