<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1684-1859</journal-id>
<journal-title><![CDATA[Revista Cubana de Informática Médica]]></journal-title>
<abbrev-journal-title><![CDATA[RCIM]]></abbrev-journal-title>
<issn>1684-1859</issn>
<publisher>
<publisher-name><![CDATA[Universidad de Ciencias Médicas de La Habana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1684-18592016000100009</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Toma de decisiones inteligente a partir de registros médicos almacenados en CDA-HL7]]></article-title>
<article-title xml:lang="en"><![CDATA[Intelligent decision-making from medical records stored on the CDA-HL7]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Fuentes Herrera]]></surname>
<given-names><![CDATA[Ivett E]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Magdaleno Guevara]]></surname>
<given-names><![CDATA[Damny]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[García Lorenzo]]></surname>
<given-names><![CDATA[María Matilde]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Central Marta Abreu de Las Villas Facultad de Matemática-Física-Computación Centro de Estudios de Informática]]></institution>
<addr-line><![CDATA[Santa Clara ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Central Marta Abreu de Las Villas Centro de Estudios de Informática ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>15</day>
<month>06</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>15</day>
<month>06</month>
<year>2016</year>
</pub-date>
<volume>8</volume>
<numero>1</numero>
<fpage>109</fpage>
<lpage>124</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S1684-18592016000100009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S1684-18592016000100009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S1684-18592016000100009&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Debido al incremento exponencial de la información almacenada en las organizaciones, la Sociedad de la Información está siendo superada por la necesidad de nuevos métodos capaces de procesar la información y asegurar su uso productivo. Esto se hace lógicamente extensible a los centros hospitalarios, a partir del uso extendido de las Historias Clínicas en formato electrónico. Disponer de información sistematizada, gestionarla de forma eficiente y segura es esencial para garantizar mejores prácticas en salud. A esto se le añade la necesidad de soportar estándares que permitan el intercambio entre las instituciones de salud; específicamente HL7 se ha convertido en uno de los más utilizados debido a que proporciona el intercambio a partir del metalenguaje XML. En este trabajo se propone una metodología para el descubrimiento de conocimiento implícito en Historias Clínicas en formato semi-estructurado utilizando el contenido y la estructura de los mismos. Los principales resultados son: (1) La metodología para el agrupamiento de Historias Clínicas; (2) La interpretación de los resultados del agrupamiento para asistir la toma de decisiones diagnósticas; (3) La implementación del estándar HL7, para la manipulación de documentos médicos a partir de CDA.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Due to the exponential increase of stored information the organizations, the information society is being overtaken by the need for new methods capable of processing information and ensuring its productive use. This is logically extended to the hospitals, from the widespread use of clinical histories in electronic format. To have systematized information, manage it efficiently and securely is essential to ensure better health practices. In addition, there is the need for standards to support the exchange among health institutions; specifically hl7 has become one of the most widely used because it provides the exchange from xml. In this paper is presented a methodology for the discovery of implicit knowledge in medical records with semi-structured format, using their content and structure. The main results are: (1) the methodology for the clustering of medical records; (2) the interpretation of the results of the clustering to assist diagnostic decision-making; (3) the implementation of the hl7 standard for handling medical records from CDA.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[agrupamiento]]></kwd>
<kwd lng="es"><![CDATA[descubrimiento de conocimiento]]></kwd>
<kwd lng="es"><![CDATA[HCE]]></kwd>
<kwd lng="es"><![CDATA[XML]]></kwd>
<kwd lng="es"><![CDATA[CDA]]></kwd>
<kwd lng="en"><![CDATA[clustering]]></kwd>
<kwd lng="en"><![CDATA[knowledge discovering]]></kwd>
<kwd lng="en"><![CDATA[EMR]]></kwd>
<kwd lng="en"><![CDATA[XML]]></kwd>
<kwd lng="en"><![CDATA[CDA]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font size="2" face="Verdana"> <b>ART&Iacute;CULO ORIGINAL</b></font></p>     <p align="right">&nbsp;</p>     <p align="left"><font size="4" face="Verdana"><strong>Toma de decisiones inteligente    a partir de registros m&eacute;dicos almacenados en CDA-HL7</strong></font></p>     <p align="left">&nbsp;</p>     <p align="left"><font size="3" face="Verdana"><strong>Intelligent decision-making    from medical records stored on the CDA-HL7</strong> </font></p>     <p align="left">&nbsp;</p>     <p align="left">&nbsp;</p>     <p align="left"><strong><font size="2" face="Verdana">Ivett E. Fuentes Herrera,<sup>I</sup>    Damny Magdaleno Guevara,<sup>II</sup> Mar&iacute;a Matilde Garc&iacute;a Lorenzo<sup>II</sup></font>    </strong> </p> <font size="1">     <P><font size="2" face="Verdana">I Centro de Estudios de Inform&aacute;tica, Facultad    de Matem&aacute;tica-F&iacute;sica-Computaci&oacute;n, Universidad Central &quot;Marta    Abreu&quot; de Las Villas, Cuba. E-mail: <a href="mailto:ivett@uclv.cu">ivett@uclv.cu</a>,    Carretera a Camajuan&iacute;, Km 5&#189;. Santa Clara, Villa Clara, CP 54830    <br>   </font><font size="2" face="Verdana">II Centro de Estudios de Inform&aacute;tica,    Universidad Central &quot;Marta Abreu&quot; de Las Villas, Cuba.</font>      ]]></body>
<body><![CDATA[<P>&nbsp;     <P>&nbsp;     <P>&nbsp;</font> <hr> <font size="2" face="Verdana"><strong>RESUMEN</strong></font>      <P><font size="2" face="Verdana">Debido al incremento exponencial de la informaci&oacute;n    almacenada en las organizaciones, la Sociedad de la Informaci&oacute;n est&aacute;    siendo superada por la necesidad de nuevos m&eacute;todos capaces de procesar    la informaci&oacute;n y asegurar su uso productivo. Esto se hace l&oacute;gicamente    extensible a los centros hospitalarios, a partir del uso extendido de las Historias    Cl&iacute;nicas en formato electr&oacute;nico. Disponer de informaci&oacute;n    sistematizada, gestionarla de forma eficiente y segura es esencial para garantizar    mejores pr&aacute;cticas en salud. A esto se le a&ntilde;ade la necesidad de    soportar est&aacute;ndares que permitan el intercambio entre las instituciones    de salud; espec&iacute;ficamente HL7 se ha convertido en uno de los m&aacute;s    utilizados debido a que proporciona el intercambio a partir del metalenguaje    XML. En este trabajo se propone una metodolog&iacute;a para el descubrimiento    de conocimiento impl&iacute;cito en Historias Cl&iacute;nicas en formato semi-estructurado    utilizando el contenido y la estructura de los mismos. Los principales resultados    son: (1) La metodolog&iacute;a para el agrupamiento de Historias Cl&iacute;nicas;    (2) La interpretaci&oacute;n de los resultados del agrupamiento para asistir    la toma de decisiones diagn&oacute;sticas; (3) La implementaci&oacute;n del    est&aacute;ndar HL7, para la manipulaci&oacute;n de documentos m&eacute;dicos    a partir de CDA. </font>      <P><strong><font size="2" face="Verdana">Palabras Clave:</font></strong><font size="2" face="Verdana">    agrupamiento, descubrimiento de conocimiento, HCE, XML, CDA. </font>  <hr> <font size="2" face="Verdana"><strong>ABSTRACT</strong></font>     <P><font size="2" face="Verdana">Due to the exponential increase of stored information    the organizations, the information society is being overtaken by the need for    new methods capable of processing information and ensuring its productive use.    This is logically extended to the hospitals, from the widespread use of clinical    histories in electronic format. To have systematized information, manage it    efficiently and securely is essential to ensure better health practices. In    addition, there is the need for standards to support the exchange among health    institutions; specifically hl7 has become one of the most widely used because    it provides the exchange from xml. In this paper is presented a methodology    for the discovery of implicit knowledge in medical records with semi-structured    format, using their content and structure. The main results are: (1) the methodology    for the clustering of medical records; (2) the interpretation of the results    of the clustering to assist diagnostic decision-making; (3) the implementation    of the hl7 standard for handling medical records from CDA. </font>      <P><font size="2" face="Verdana"><strong>Key words:</strong> clustering, knowledge    discovering, EMR, XML, CDA.</font> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana"><strong>INTRODUCCI&Oacute;N</strong> </font>  </p>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">En el actual siglo XXI, el mundo desarrollado    se ha propuesto lograr la globalizaci&oacute;n del acceso a los enormes vol&uacute;menes    de informaci&oacute;n existentes en medios cada vez m&aacute;s complejos, con    capacidades exponencialmente crecientes de almacenamiento y en soportes cada    vez m&aacute;s reducidos, por lo que nadie pone en duda el papel que juegan    las nuevas Tecnolog&iacute;as de la Informaci&oacute;n y las Comunicaciones    (TIC) en las organizaciones. Esto se hace, l&oacute;gicamente, extensible a    la Gesti&oacute;n Documental (GD), que administra el flujo de documentos e informaci&oacute;n    en las instituciones . Surge as&iacute;, la necesidad de capturar y conservar    tambi&eacute;n documentos que nacen, viven y mueren en formato electr&oacute;nico,    principalmente en las organizaciones en las que se pueden realizar estudios    basados en experiencias anteriores. Particularmente, disponer de herramientas    que permitan relacionar documentos y darles una sem&aacute;ntica com&uacute;n,    constituye una posibilidad de sistematizar la enorme riqueza de datos e informaci&oacute;n    que reside en los sistemas hospitalarios en entornos educativos y de investigaci&oacute;n.<sup>1</sup>    </font>      <P><font size="2" face="Verdana">A lo anterior se a&ntilde;ade que actualmente    en nuestro pa&iacute;s, los sistemas de registro de Historias Cl&iacute;nicas    (HC) en las instituciones de salud son ineficientes, no son automatizados, ocupan    mucho espacio f&iacute;sico y no vinculan la informaci&oacute;n del paciente    con los dem&aacute;s hospitales, cl&iacute;nicas u otros organismos de atenci&oacute;n    de salud p&uacute;blica. Es decir, las HC que se registran no son universales.    Por lo tanto, es imperativo que el Sistema de Salud del pa&iacute;s haga la    transici&oacute;n del registro de HC en formato duro a un registro de Historias    Cl&iacute;nicas Electr&oacute;nicas (HCE), donde cada paciente tenga una HC    &uacute;nica y con car&aacute;cter universal. Adem&aacute;s en el contexto mundial,    los usos de la HCE cada d&iacute;a impactan de manera creciente y favorable    en la investigaci&oacute;n cl&iacute;nica, en la investigaci&oacute;n farmac&eacute;utica    (d&iacute;gase ensayos cl&iacute;nicos, f&aacute;rmaco-epidemiol&oacute;gicos)    y en las investigaciones en salud p&uacute;blica (d&iacute;gase informes electr&oacute;nicos    de casos, bases de datos poblacionales), entre otros.<sup>2,3</sup> Como consecuencia,    la creaci&oacute;n de repositorios de HCE y el volumen de informaci&oacute;n    generada desde estos, debe aumentar continua y exponencialmente. La automatizaci&oacute;n    de la informaci&oacute;n cl&iacute;nica proporciona enormes ventajas tanto para    los profesionales de la salud, como para los pacientes, y el estado. Es as&iacute;    que surgen nuevas oportunidades para adoptar herramientas que apoyen la toma    de decisiones en la pr&aacute;ctica cl&iacute;nica y proporcionar mejores condiciones    de trabajo a los m&eacute;dicos, contribuir al ejercicio de una medicina basada    en la evidencia y asegurar el uso productivo de la informaci&oacute;n almacenada.<sup>4,5</sup>    En este sentido, aunque se han desarrollado varios sistemas con el prop&oacute;sito    de lograr una r&aacute;pida y eficiente manera de compartir informaci&oacute;n,    la heterogeneidad de ella determina que extraer conocimiento relevante se convierta    en un proceso complejo y desafiante.<sup>5</sup> </font>      <P><font size="2" face="Verdana">Es reconocido por varios investigadores<sup>1,4,6,7</sup>    la importancia de la estandarizaci&oacute;n y codificaci&oacute;n de datos almacenados    en la HCE, as&iacute; como la necesidad de migrar a una recopilaci&oacute;n    de la informaci&oacute;n cl&iacute;nica mediante texto estructurado. Particularmente    en el contexto de la HC, la propia distribuci&oacute;n de sus elementos hace    posible concebirla como un documento XML, debido a la estructura jer&aacute;rquica    y auto-descriptiva impl&iacute;cita en cada uno de los factores que la componen.    De hecho, Health Level Seven (HL7), el conjunto de est&aacute;ndares inform&aacute;ticos    de salud m&aacute;s desarrollado y de mayor cobertura internacional para dar    soporte a la HCE est&aacute; sustentado en el metalenguaje XML.<sup>4</sup> </font>      <P><font size="2" face="Verdana">Extensible Markup Language (XML) es un metalenguaje    desarrollado por el consorcio W3C2 proveniente de Generalized Markup Language    (GML) que surgi&oacute; ante la necesidad de la gran empresa de almacenar grandes    cantidades de informaci&oacute;n. Un documento XML es una estructura jer&aacute;rquica    auto-descriptiva de informaci&oacute;n, que consiste en un conjunto de &aacute;tomos,    elementos compuestos y atributos.<sup>2</sup> A esto se a&ntilde;ade que los    documentos XML contienen su informaci&oacute;n en forma semi-estructurada, al    incorporar estructura y datos en una misma entidad. Son extensibles, con estructura    de f&aacute;cil an&aacute;lisis y procesamiento, por lo que XML se ha convertido    en el formato de intercambio de datos est&aacute;ndar entre las aplicaciones    Web.<sup>2,8,9</sup> Las etiquetas existentes en los documentos XML permiten    la descripci&oacute;n sem&aacute;ntica del contenido de sus elementos. De este    modo, la estructura de los documentos puede ser explotada para realizar recuperaci&oacute;n    de documentos relevantes.<sup>5</sup> </font>      <P><font size="2" face="Verdana">Por lo anteriormente planteado se hace inevitable    crear t&eacute;cnicas para el an&aacute;lisis eficiente de grandes colecciones    de este tipo de documentos y extraer conocimiento relevante. Existen tres enfoques    para abordarlo: la clasificaci&oacute;n, la categorizaci&oacute;n y el agrupamiento;    en este &uacute;ltimo varios investigadores se han concentrado, debido a que    exclusivamente, el agrupamiento de documentos XML permite organizar la informaci&oacute;n,    delimitar la informaci&oacute;n relevante y descubrir nuevo conocimiento a partir    de la informaci&oacute;n disponible en una colecci&oacute;n obtenida como resultado    de un proceso de recuperaci&oacute;n de informaci&oacute;n.<sup>3,10-12</sup></font>      <P><font size="2" face="Verdana">Un algoritmo de agrupamiento intenta encontrar    grupos naturales de datos, bas&aacute;ndose principalmente en la similitud y    las relaciones de los objetos, de forma tal que se obtenga una distribuci&oacute;n    interna del conjunto de datos en grupos. Cuando el agrupamiento se basa en la    similitud de los objetos, se desea que los objetos que pertenecen al mismo grupo    sean tan similares como se pueda y los objetos que pertenecen a grupos diferentes    sean tan dis&iacute;miles como sea posible. El an&aacute;lisis de grupos permite    descubrir una estructura previamente oculta en los datos, sin embargo, la asignaci&oacute;n    de los objetos a las clases y la descripci&oacute;n de esas clases son desconocidas.<sup>13</sup>    El desarrollo de sistemas que faciliten a los usuarios gestionar grandes colecciones    de documentos, mediante la organizaci&oacute;n y extracci&oacute;n del conocimiento    es una necesidad real. Explotar la estructura espec&iacute;fica que tienen las    HC puede ofrecer resultados favorables en el agrupamiento de este tipo de documentos,    y contribuir de manera significativa a la gesti&oacute;n del conocimiento. </font>      <P><font size="2" face="Verdana">Cuando se trata de documentos XML, los algoritmos    de agrupamiento se clasifican principalmente en tres grupos: los que se centran    s&oacute;lo en el contenido de los documentos, sin embargo un buen proceso de    agrupamiento no puede descartar el uso de la estructura, por lo que est&aacute;n    los algoritmos que utilizan s&oacute;lo la estructura, considerando que esta    juega un papel importante en el agrupamiento para ciertas aplicaciones espec&iacute;ficas    y los que combinan ambas componentes: estructura y contenido, lo cual constituye    un nuevo desaf&iacute;o, ya que la mayor&iacute;a de los enfoques existentes    no utilizan estas dos dimensiones dada su gran complejidad.<sup>14</sup> </font>     <P><font size="2" face="Verdana">Lo antes expuesto ratifica la siguiente problem&aacute;tica:    </font>     <P><font size="2" face="Verdana">Aunque como ya se mencion&oacute;, existen varias    formas de gestionar el conocimiento: la categorizaci&oacute;n, la clasificaci&oacute;n    y el agrupamiento, los sistemas de informaci&oacute;n hospitalarios no implementan    mecanismos que garanticen el uso productivo de la informaci&oacute;n cl&iacute;nica    para asistir la toma de decisiones diagn&oacute;sticas. </font>     <P><font size="2" face="Verdana">En este trabajo se presentan los resultados siguientes:    (1) La metodolog&iacute;a para el agrupamiento de Historias Cl&iacute;nicas;    (2) La interpretaci&oacute;n de los resultados del agrupamiento para asistir    la toma de decisiones diagn&oacute;sticas; (3) La implementaci&oacute;n del    est&aacute;ndar HL7 para la manipulaci&oacute;n de documentos m&eacute;dicos    a partir de CDA. </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">El valor pr&aacute;ctico del trabajo est&aacute;    enfocado a: </font>     <P><font size="2" face="Verdana">Disponer de un sistema de recuperaci&oacute;n    de informaci&oacute;n que soporte la metodolog&iacute;a, que permita procesar    grandes vol&uacute;menes de datos y obtener conocimiento relevante a partir    de la informaci&oacute;n recuperada, con el prop&oacute;sito de asistir a los    expertos de salud en el proceso de toma de decisiones diagn&oacute;sticas, inferir    &aacute;reas que deben ser exploradas y conducir al desarrollo de investigaciones    cl&iacute;nicas, valorar la efectividad terap&eacute;utica y la evoluci&oacute;n    favorable de los pacientes ante un tratamiento. </font>     <P><strong><font size="2" face="Verdana"> INFORMACI&Oacute;N CL&Iacute;NICA Y    AGRUPAMIENTO DOCUMENTAL </font> </strong>     <P><font size="2" face="Verdana">Cada d&iacute;a m&aacute;s datos electr&oacute;nicos    son presentados debido al crecimiento continuo de informaci&oacute;n desde m&uacute;ltiples    campos y la automatizaci&oacute;n de gran parte de los procesos de la sociedad.    Esto se hace extensible a la gesti&oacute;n de la informaci&oacute;n cl&iacute;nica,    debido al criterio extendido de brindar soporte a la pr&aacute;ctica m&eacute;dica    facultativa de una medicina basada en la evidencia.<sup>1</sup> </font>     <P><font size="2" face="Verdana">La HC es un documento v&aacute;lido desde el    punto de vista cl&iacute;nico y legal a todos los niveles de atenci&oacute;n    en salud, que recoge informaci&oacute;n de tipo asistencial, preventivo y social.    Es una fuente esencial de datos y constituye el documento principal de un Sistema    de Informaci&oacute;n Hospitalaria (HIS). Es una herramienta b&aacute;sica para    las investigaciones biom&eacute;dicas, la formaci&oacute;n de estudiantes y    la educaci&oacute;n m&eacute;dica postgraduada en la consecuci&oacute;n de investigaciones.    Constituye, adem&aacute;s, el registro completo de la atenci&oacute;n prestada    al paciente durante su enfermedad, de ah&iacute; su trascendencia como documento    legal. Es la fuente que, adem&aacute;s de recoger todo un informe de salud,    comunica el pensamiento m&eacute;dico, registra observaciones, diagn&oacute;sticos    e intervenciones que reflejan uno o varios problemas; sin embargo, su formato    tradicional enfrenta diversas dificultades, que se han hecho evidentes durante    la pr&aacute;ctica diaria como son: su deterioro o p&eacute;rdida, debido a    que la historia convencional, en su formato de papel, s&oacute;lo puede existir    en un lugar y en un momento y condiciones determinados, as&iacute; como la presencia    de una escritura pobre, ilegible e incompleta que dificulta la interpretaci&oacute;n    del mensaje que se pretende enviar. Otra de sus limitaciones es que s&oacute;lo    puede contribuir de forma pasiva a la toma de decisiones y esto dificulta el    an&aacute;lisis con fines cient&iacute;ficos o de planeamiento de estrategias    de salud.<sup>6</sup> </font>     <P><font size="2" face="Verdana">La HC incluye la informaci&oacute;n cl&iacute;nica    relacionada con los datos del paciente, antecedentes personales y familiares,    h&aacute;bitos t&oacute;xicos y todos los elementos relacionados con su salud    biopsicosocial; el proceso evolutivo, el tratamiento y la recuperaci&oacute;n.<sup>7</sup> La HC es un documento donde el paciente deja registrado su consentimiento    para ser utilizado en la toma de decisiones del profesional de la salud. </font>     <P><font size="2" face="Verdana">Para gestionarlo existen varios modelos seg&uacute;n    el lugar donde se genera: cronol&oacute;gico, la historia cl&iacute;nica orientada    a problemas (HCOP) y la protocolizada. Algunos componentes de los modelos cl&aacute;sicos    de la HC, como la orientada hacia el problema, se consideran especialmente adecuados    para su uso con fines educativos y cient&iacute;ficos.<sup>6</sup> En este trabajo se    propone utilizar el modelo cronol&oacute;gico generado en los hospitales. </font>     <P><font size="2" face="Verdana">En este sentido, se evidencia la necesidad de    incorporar las TIC en el n&uacute;cleo de la actividad hospitalaria, lo que    implica ofrecer soporte a la HCE. De manera que, cada HC se convierta en un    simple registro de la informaci&oacute;n, que se integra al HIS de la instituci&oacute;n.    Sin embargo, la conceptualizaci&oacute;n y aplicaci&oacute;n de las TIC en este    &aacute;mbito no es un proceso acabado, debido a que existen problemas que limitan    el uso productivo de la informaci&oacute;n: la integraci&oacute;n efectiva de    la HCE y el uso de herramientas de aprendizaje autom&aacute;tico de la inteligencia    artificial. A esto se a&ntilde;aden los problemas relacionados con la codificaci&oacute;n    de t&eacute;rminos y el uso de est&aacute;ndares.<sup>1,4</sup> </font>     <P><strong><font size="2" face="Verdana"> Usos actuales de HCE en la investigaci&oacute;n    </font> </strong>     <P><font size="2" face="Verdana">Los registros inform&aacute;ticos de los servicios    de admisi&oacute;n hospitalarios se utilizan en el desarrollo de investigaciones    cl&iacute;nicas y epidemiol&oacute;gicas, en ausencia de otras fuentes de datos    cl&iacute;nicos bien estructuradas capaces de generar conocimiento [4]. Por    lo que debe potenciarse el desarrollo de herramientas que permitan almacenar    adecuadamente esta informaci&oacute;n y hacerla accesible.<sup>4,7</sup> </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Esto implicar&iacute;a inferir &aacute;reas que    deben ser interpretadas por los expertos en salud a partir de la informaci&oacute;n    disponible y garantizar su uso productivo con el fin de llevar a cabo investigaciones    cl&iacute;nicas, lograr nuevas soluciones diagn&oacute;sticas y terap&eacute;uticas,    la evaluaci&oacute;n del uso de las tecnolog&iacute;as empleadas en casos de    dif&iacute;cil control, el estudio de la evoluci&oacute;n de los pacientes,    la eficacia y la eficiencia de la atenci&oacute;n, la identificaci&oacute;n    de poblaciones de riesgo, y el an&aacute;lisis de la eficiencia del proceso.    </font>     <P><strong><font size="2" face="Verdana"> Interoperabilidad y el est&aacute;ndar    CDA-HL7 </font> </strong>     <P><font size="2" face="Verdana">Para lograr este intercambio, es necesario que    los sistemas de informaci&oacute;n utilizados por las instituciones de salud,    pongan en pr&aacute;ctica las normas reconocidas internacionalmente, especialmente    las establecidas por el est&aacute;ndar HL7, por lo que la recopilaci&oacute;n    de informaci&oacute;n cl&iacute;nica debe ir migrando al uso controlado de texto    estructurado. Uno de los principales aportes de este trabajo es concebir la    HCE seg&uacute;n el est&aacute;ndar Clinical Document Architecture (CDA) de    HL7 que especifica la estructura y sem&aacute;ntica de los documentos cl&iacute;nicos    con el prop&oacute;sito de facilitar su intercambio en un entorno de interoperabilidad.    </font>     <P><font size="2" face="Verdana">CDA-HL7 es un est&aacute;ndar de marcaje, realizado    por el comit&eacute; Structured Documents Technical Committee (SDTC) de HL7,    que permite definir la estructura y la sem&aacute;ntica de un documento cl&iacute;nico.    Es una especificaci&oacute;n que facilita el intercambio entre los diferentes    sistemas en las organizaciones al utilizar XML. </font>     <P><font size="2" face="Verdana">CDA logra que los documentos sean computacionalmente    m&aacute;s legibles. Gracias a la utilizaci&oacute;n de XML, Reference Information    Model (RIM), la metodolog&iacute;a de la versi&oacute;n v3 de HL7 y los vocabularios    codificados, los documentos cl&iacute;nicos pueden ser interpretados y procesados    autom&aacute;ticamente. Las colecciones de documentos CDA pueden ser presentadas    directamente a los navegadores Web compatibles con XML. Es posible crearlos    y validarlos mediante una plantilla XML o Schema. Y su dise&ntilde;o tiene como    principal prop&oacute;sito ofrecer a los pacientes un mejor servicio. Permite    una implementaci&oacute;n efectiva y eficiente en su costo en un espectro amplio    de sistemas heterog&eacute;neos, siendo independiente de la plataforma. Soporta    el intercambio de documentos legibles entre los usuarios, permitiendo presentar    la informaci&oacute;n de forma adecuada a usuarios con diferentes requisitos    y conocimiento. Por su dise&ntilde;o, facilita un amplio rango de procesamiento,    al ser f&aacute;cilmente compatible con muchas aplicaciones de creaci&oacute;n    y GD. </font>     <P><font size="2" face="Verdana">Un documento CDA contiene una cabecera y un cuerpo.    La cabecera sigue una estructura com&uacute;n, que identifica y clasifica el    documento, provee informaci&oacute;n acerca de la autenticaci&oacute;n, paciente,    autor y actores involucrados. Por lo que al seguir una estructura com&uacute;n,    bien definida, la consulta de estos campos de forma automatizada es f&aacute;cil.    </font>     <P><font size="2" face="Verdana">El cuerpo del documento, puede contener tres    niveles de implementaci&oacute;n: el nivel m&aacute;s bajo, implica una implementaci&oacute;n    m&aacute;s sencilla pero no utiliza muchas de las ventajas de la arquitectura    CDA. El m&aacute;s alto ofrece una verdadera interoperabilidad sem&aacute;ntica,    pero implica un esfuerzo m&aacute;s amplio en la implementaci&oacute;n y requiere    una madurez en los sistemas que generan y capturan los datos de los documentos.    El nivel 2 sigue una estructura XML bien definida con secciones de informaci&oacute;n    identificadas, cuyo contenido es libre, lo cual facilita al actor del documento    realizar una descripci&oacute;n l&oacute;gica de cada uno de los elementos que    refiere. El nivel 3 agrega a cada secci&oacute;n, y a cada dato dentro de estas    secciones (diagn&oacute;sticos, unidades de medici&oacute;n, medicamentos, etc.)    Este nivel tiene muchas ventajas, ya que garantiza la verdadera interoperabilidad    sem&aacute;ntica, permitiendo que los documentos sean procesables, mediante    b&uacute;squedas y t&eacute;cnicas de Miner&iacute;a de Datos . </font>     <P><font size="2" face="Verdana">Estas ventajas hacen que CDA sea uno de las especificaciones    m&aacute;s utilizadas regionalmente en los sistemas de gesti&oacute;n de informaci&oacute;n    cl&iacute;nica. Por ello en este trabajo, proponemos concebir la HCE como un    documento XML, que tiene impl&iacute;citas secciones.<sup>4</sup> En la <a href="#fig1">figura    1</a> se observa un ejemplo de una HCE correspondiente a un documento XML definido    en el est&aacute;ndar CDA. </font>      <P align="center"><img src="/img/revistas/rcim/v8n1/f0109116.jpg" width="482" height="444"> <a name="fig1"></a>     <P><font size="2" face="Verdana">Debido a su estructura jer&aacute;rquica y auto-descriptiva    un documento XML es m&aacute;s natural tratarlo como un conjunto de partes o    una serie de secciones (que se puede dividir en varias subsecciones, etc.).    Como consecuencia la HCE puede verse como una colecci&oacute;n {D1, ..., Dm},    donde cada Di contiene un conjunto de Unidades Estructurales (UE) UE = {UE1,    ..., UEn}, con lo cual desaparece el concepto de documento como unidad indivisible.<sup>5</sup>    Las diferentes UE identificadas sem&aacute;nticamente en la HCE cronol&oacute;gica,    basado en criterios de expertos, se muestra en la <a href="/img/revistas/rcim/v8n1/f0209116.jpg">figura    2</a>. </font>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Esta propuesta nos permite obtener una representaci&oacute;n    estandarizada del conocimiento impl&iacute;cito en una colecci&oacute;n de HC    y proporcionar soporte a la toma de decisiones. </font>      <P><strong><font size="2" face="Verdana">Acerca del agrupamiento de HCE </font>    </strong>     <P><font size="2" face="Verdana">Un agrupamiento de documentos intenta encontrar    una estructura del conjunto de datos en grupos naturales basado principalmente    en la similitud y las relaciones de los objetos, para obtener una distribuci&oacute;n    interna que logre homogeneidad dentro de los grupos y heterogeneidad entre ellos.<sup>13,14</sup>     De manera, que los objetos que pertenezcan a un mismo grupo sean    tan similares como sea posible y los objetos que pertenezcan a grupos diferentes,    sean tan dis&iacute;miles como se pueda. En este trabajo, se propone realizar    el agrupamiento de una colecci&oacute;n de HCE basado en el agrupamiento de    documentos XML, debido a que, al implementar CDA, una HCE es un documento XML.    As&iacute;, los resultados obtenidos pueden ser analizados y explicar la l&oacute;gica    de las acciones tomadas por un m&eacute;dico ante situaciones similares.<sup>15-17</sup> Adem&aacute;s, m&uacute;ltiples HC agrupadas por signos, s&iacute;ntomas,    incidencia y prevalencia, diagn&oacute;stico diferencial, antecedentes personales    y familiares, h&aacute;bitos t&oacute;xicos, tratamientos y diagn&oacute;stico    pueden contribuir a mejores pr&aacute;cticas de salud. </font>     <P><strong><font size="2" face="Verdana"> Agrupamiento de HCE basado en una metodolog&iacute;a    para el agrupamiento de documentos XML </font> </strong>     <P><font size="2" face="Verdana">Debido a que un documento XML contiene informaci&oacute;n    semi-estructurada, se han propuesto varios trabajos relacionados con el agrupamiento    de documentos XML teniendo en cuenta que existen tres variantes:<sup>2,10,18</sup>    las que consideran s&oacute;lo el contenido,<sup>9,13,14</sup> las que utilizan    s&oacute;lo su estructura<sup>8,10,11,18-20</sup> y las que combinan ambas dimensiones    .<sup>21-25</sup> No obstante, la mayor&iacute;a de los enfoques existentes    no combinan sus dos dimensiones: estructura y contenido, dada su complejidad;    sin embargo, para mejores resultados en el agrupamiento es esencial utilizar    ambas.<sup>26</sup> La <a href="#tab1">tabla 1</a> muestra un resumen de algunos    trabajos relacionados con el dise&ntilde;o de algoritmos para el agrupamiento    de documentos XML. </font>      <P><font size="2" face="Verdana">En esta secci&oacute;n, se presenta una metodolog&iacute;a    para el agrupamiento de documentos XML, as&iacute; como una nueva funci&oacute;n    de similitud, OverallSimSUX<sup>27</sup> que facilita capturar el grado de similitud    entre los documentos. </font>      <P><font size="2" face="Verdana">La relaci&oacute;n estructural existente entre    los documentos XML puede aportar mejores resultados al agrupamiento, cuando    se utiliza el contenido en funci&oacute;n de la relaci&oacute;n existente entre    sus UE. En este trabajo, se propone un conjunto de UE para gestionar la HCE    definidas a partir del criterio de expertos, vale recordar que una UE se corresponde    con un conjunto de etiquetas con significado sem&aacute;ntico. </font>     <P><font size="2" face="Verdana"> UE = {Datos personales , antecedentes, s&iacute;ntomas,    signos, incidencia, prevalencia, diagn&oacute;stico diferencial, complementarios,    tratamientos, evoluci&oacute;n, diagn&oacute;stico}. </font>     <P align="center"><font size="2" face="Verdana"><img src="/img/revistas/rcim/v8n1/t0109116.gif" width="438" height="1124">    <a name="tab1"></a> </font>      <P>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">La construcci&oacute;n de la matriz de similitud    basada en el c&aacute;lculo de la medida de similitud OverallSimSUX facilita    capturar el grado de similitud entre los documentos. Esta funci&oacute;n analiza    la relaci&oacute;n existente entre los documentos, cada uno de los cuales se    corresponde con una HCE de la colecci&oacute;n, tratando simult&aacute;neamente    los documentos como unidades indivisibles y cada colecci&oacute;n de UE como    colecciones independientes. Una vista gr&aacute;fica del modelo del esquema    para construir la matriz de similitud OverallSimSUX en este trabajo se muestra    en la <a href="#fig3">figura 3</a>. </font>      <div align="center"><img src="/img/revistas/rcim/v8n1/f0309116.jpg" width="463" height="484"> <a name="fig3"></a></div>     <P>      <P><font size="2" face="Verdana">En la <a href="/img/revistas/rcim/v8n1/f0409116.jpg">figura 4</a>,    se detalla el procedimiento general para la construcci&oacute;n de esta matriz,    para lo cual son necesarios tres pasos: (1) Pre-procesamiento de toda la colecci&oacute;n,    identificando cada UE; (2) Representaci&oacute;n Textual, a partir de la Representaci&oacute;n    I (R-I) y Representaci&oacute;n II (R-II) y (3) Proceso de Agrupamiento Final.    </font>     <P><strong><font size="2" face="Verdana">Pre-procesamiento (Paso 1) </font> </strong>     <P><font size="2" face="Verdana">La propuesta presentada en este trabajo responde    a la necesidad de desarrollar herramientas para la gesti&oacute;n de la informaci&oacute;n    cl&iacute;nica y brindar soporte al descubrimiento de conocimiento. Con el fin    de disponer de datos fiables para estandarizar los t&eacute;rminos con la misma    sem&aacute;ntica, en la etapa de pre-procesamiento deben garantizarse el filtrado    de la informaci&oacute;n y la unificaci&oacute;n de la terminolog&iacute;a utilizada    por el personal m&eacute;dico. </font>     <P><strong><font size="2" face="Verdana"> Representaci&oacute;n Textual (Paso    2) </font> </strong>     <P><font size="2" face="Verdana">Obtener las representaciones: Representaci&oacute;n    I (R-I), a partir de las UE definidas para los documentos HCE, cada colecci&oacute;n    independiente se corresponde con la colecci&oacute;n que contiene las k-&eacute;simas    UE de cada uno de los documentos de la colecci&oacute;n de HCE original; Representaci&oacute;n    II (R-II), se realiza teniendo en cuenta la colecci&oacute;n completa y los    resultados de los agrupamientos realizados utilizando las representaciones R-I.    </font>     <P><strong><font size="2" face="Verdana"> Representaci&oacute;n I </font> </strong>     <P><font size="2" face="Verdana">La colecci&oacute;n original de documentos se    divide en k-colecciones. El concepto de k-colecci&oacute;n<sup>27</sup> refleja    la correspondencia entre la colecci&oacute;n y la UE. Para cada k-colecci&oacute;n    la Representaci&oacute;n I se realiza utilizando la representaci&oacute;n cl&aacute;sica    VSM. En particular, la construcci&oacute;n de esta matriz se lleva a cabo mediante    el c&aacute;lculo de la frecuencia TF-IDF.<sup>6</sup> TF-IDF es una medida estad&iacute;stica    de peso utilizada en el procesamiento del lenguaje natural para determinar la    importancia de un t&eacute;rmino en una colecci&oacute;n dada, mediante el uso    de la representaci&oacute;n vectorial. La importancia de cada t&eacute;rmino    aumenta proporcionalmente al n&uacute;mero de veces que aparece este t&eacute;rmino    en el documento (frecuencia), y se compensa con la frecuencia del t&eacute;rmino    en la colecci&oacute;n. </font>      ]]></body>
<body><![CDATA[<P><strong><font size="2" face="Verdana"> Representaci&oacute;n II </font> </strong>     <P><font size="2" face="Verdana">En este trabajo la estructura de la HCE se adiciona    al an&aacute;lisis, por lo tanto, la Representaci&oacute;n II es una modificaci&oacute;n    de la cl&aacute;sica representaci&oacute;n VSM y la frecuencia se pondera teniendo    en cuenta la UE en la que aparece el t&eacute;rmino analizado, seg&uacute;n    se define en la <a href="#ec1">ecuaci&oacute;n 1</a> para un t&eacute;rmino    ti y un documento dj, donde n es la cantidad de UE presentes en dj , frik es    la frecuencia de ti en la UEk y wk es el peso de la UEk en la HCE dj. El c&aacute;lculo    del peso de la UEk para cada documento dj se realiza a partir de la <a href="#ec2">ecuaci&oacute;n    2</a>; LUE es la longitud de la UEk, LDoc es la longitud del documento dj y    la pot es un valor dado. De esta manera la idea queda formalizada correctamente.    Sin embargo, si hay elementos que tienen en la HC mayor valor diagn&oacute;stico    o inter&eacute;s que otros, estos pueden ser tratados como t&eacute;rminos difusos,    a partir de un conjunto de valores de membres&iacute;a establecidos por el experto.    (<a href="/img/revistas/rcim/v8n1/t0209116.gif">tabla 2</a>) </font>      <P>&nbsp;      <P align="center"><font size="2" face="Verdana"><img src="/img/revistas/rcim/v8n1/e0109116.jpg" width="224" height="88"></font>    <a name="ec1"></a>     <P align="center"><img src="/img/revistas/rcim/v8n1/e0209116.jpg" width="238" height="69"><a name="ec2"></a>     <P><strong><font size="2" face="Verdana"> Agrupamiento de las k-colecciones </font>    </strong>     <P><font size="2" face="Verdana">A partir de la Representaci&oacute;n I se calcula    la matriz de similitud, que compara dos documentos utilizando la medida coseno;    a partir de la <a href="#ec3">ecuaci&oacute;n 3</a>. Se realiza un agrupamiento    independiente para cada k-colecci&oacute;n. Para llevar a cabo el agrupamiento,    se utiliza el cl&aacute;sico algoritmo K-Star.<sup>22</sup> </font>      <P>      <P align="center"><font size="2" face="Verdana"> </font><img src="/img/revistas/rcim/v8n1/e0309116.jpg" width="218" height="128"><a name="ec3"></a>     <P><strong><font size="2" face="Verdana"> C&aacute;lculo de la Matriz OverallSimSUX    </font> </strong>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">La medida de similitud OverallSimSUX, es especificada    formalmente a trav&eacute;s de la <a href="#ec4">ecuaci&oacute;n 4</a>. Se inicia    con los resultados del agrupamiento realizado para cada k-colecci&oacute;n y    la matriz de similitud basada en el c&aacute;lculo de la medida coseno, a partir    de la Representaci&oacute;n II. OverallSimSUX considera m como la cantidad de    UE identificadas en los documentos de HCE. Esta funci&oacute;n de similitud    se normaliz&oacute; por la suma de los pesos de las m UE y el valor m&aacute;ximo    de similitud global de sg (es decir, 1). Por tanto, su m&aacute;ximo valor (es    decir, 1) se alcanza cuando los documentos de HCE i, j pertenecen al mismo grupo    en todos los k-agrupamientos y el valor de sg es m&aacute;ximo. </font>      <P>      <P align="center"><font size="2" face="Verdana"> <img src="/img/revistas/rcim/v8n1/e0409116.jpg" width="237" height="95"></font>    <a name="ec4"></a>     <P><strong><font size="2" face="Verdana"> Agrupamiento Final (Paso 3) </font>    </strong>     <P><font size="2" face="Verdana">Para llevar a cabo el agrupamiento final, se    utiliza nuevamente el algoritmo de agrupamiento K -Star. </font>     <P><strong><font size="2" face="Verdana">INTERPRETACI&Oacute;N DEL AGRUPAMIENTO    DE HCE </font> </strong>     <P><font size="2" face="Verdana">El agrupamiento de HCE basado en los s&iacute;ntomas    o signos, y no s&oacute;lo teniendo en cuenta el diagn&oacute;stico final, permite    al especialista evaluar objetivamente el valor diagn&oacute;stico de una prueba    en particular, antes de inferir el resultado de las dem&aacute;s pruebas. Lograr    una visi&oacute;n coherente de la historia del paciente, lo que realmente se    ha hecho y por qu&eacute;. La relaci&oacute;n de pacientes y la correspondencia    de ellos atendiendo a sus antecedentes patol&oacute;gicos personales y familiares,    la reacci&oacute;n adversa a ciertos medicamentos en casos similares, permitir&iacute;a    explicar la causa de las acciones tomadas y decidir la conducta a seguir en    el tratamiento de ciertos pacientes. </font>     <P><font size="2" face="Verdana">Por otra parte, el beneficio de tener pacientes    similares, con iguales diagn&oacute;sticos permite a los estudiantes en menos    tiempo completar la HCE de un paciente. Utilizando la metodolog&iacute;a propuesta    y las UE de la HCE donde se concentran sus dudas, le permitir&iacute;a obtener    grupos similares de casos, y realizar recomendaciones sobre el uso correcto    de un tratamiento, un complementario, entre otras opciones. </font>     <P><font size="2" face="Verdana">Los resultados obtenidos por las colecciones    de HCE agrupadas deben interpretarse teniendo en cuenta criterios de expertos.    El uso de reglas de asociaci&oacute;n permite explicar las relaciones entre    las HCE de los pacientes, que pertenecen a un mismo grupo. Los centroides o    HCE m&aacute;s relevante de cada grupo pueden permitir a los expertos estudiar    casos similares a estos basados en criterios aplicados en ocasiones pasadas    y emitir diagn&oacute;sticos finales en un menor tiempo. </font>     <P><font size="2" face="Verdana">Para evaluar los efectos de esta metodolog&iacute;a    en las colecciones de HCE, se propone el uso de una muestra de HCE de los ingresos    hospitalarios del Servicio de Admisi&oacute;n del Hospital &quot;Arnaldo Mili&aacute;n    Castro&quot;, asociados a 45 enfermedades diferentes. </font>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">La metodolog&iacute;a ha sido validada a partir    de la aplicaci&oacute;n de una encuesta a 13 m&eacute;dicos del Hospital &quot;Celestino    Hern&aacute;ndez Robau&quot;. Cada uno de los expertos seleccionados utiliz&oacute;    el sistema con las colecciones de HCE propias de sus ramas de desempe&ntilde;o.    Algunos de los temas abordados son: cardiolog&iacute;a, hematolog&iacute;a y    gastroenterolog&iacute;a. </font>     <P><font size="2" face="Verdana">Los usuarios siempre utilizaron colecciones conocidas    para poder valorar los resultados del sistema. Los usuarios aplicaron el sistema    tanto a colecciones heterog&eacute;neas como homog&eacute;neas. Por otra parte,    la interpretaci&oacute;n de los resultados obtenidos por la metodolog&iacute;a    evaluado por expertos, asegura la viabilidad de la metodolog&iacute;a propuesta    para la gesti&oacute;n de la informaci&oacute;n cl&iacute;nica y el descubrimiento    del conocimiento impl&iacute;cito en ella. </font>     <P>&nbsp;     <P><font size="3" face="Verdana"> <strong>CONCLUSIONES</strong> </font>      <P><font size="2" face="Verdana">En este trabajo se evidencia la importancia del    agrupamiento documental para la gesti&oacute;n del conocimiento a partir de    la informaci&oacute;n cl&iacute;nica, debido a la necesidad de un conocimiento    pertinente a trav&eacute;s del uso productivo de la informaci&oacute;n contenida    en HCE y la necesidad del uso de est&aacute;ndares que garanticen la interoperabilidad    de los HIS. Fue propuesta una metodolog&iacute;a para el agrupamiento de HCE    concebidas como documentos XML, brindando soporte a la arquitectura CDA del    est&aacute;ndar HL7. Esta metodolog&iacute;a combina las dimensiones: estructura    y contenido presentes en los documentos cl&iacute;nicos lo que aporta mejores    resultados al agrupamiento. La funci&oacute;n de similitud OverallSimSUX que    incluye la metodolog&iacute;a facilita capturar el grado de similitud entre    &eacute;stos, tomando como g&eacute;nesis la relaci&oacute;n entre sus UE. Varias    UE fueron propuestas utilizando criterios de expertos, lo cual permite gestionar    colecciones de HCE utilizando la metodolog&iacute;a.</font>     <P>&nbsp;     <P><strong><font size="3" face="Verdana">REFERENCIAS BIBLIOGR&Aacute;FICAS </font>    </strong>     <!-- ref --><P><font size="2" face="Verdana">1. Engelbrecht R. K4Health. Knowledge for Health.    Integrating EHR and Knowledge for better health care. Status of the EoI and    work items. EUROREC. Berlin. </font><font size="2" face="verdana">[citado 2002    dic 14]</font><font size="2" face="Verdana">. Disponible en: <a href="http://www.eurorec.net/EUROREC_2002_presentations.html" target="_blank">http://www.eurorec.net/EUROREC_2002_presentations.html</a>    </font>      <!-- ref --><P><font size="2" face="Verdana">2. Brau B. Extensible Markup Language(XML) 1.0.,    in W3C Recommendation. 1998.     </font>      ]]></body>
<body><![CDATA[<!-- ref --><P><font size="2" face="Verdana">3. Raghan P, Sch&uuml;tze H. Introduction to    Information Retrieval. 2008 Cambridge University Press.     </font>      <!-- ref --><P><font size="2" face="Verdana">4. Zwaanswijk M, Verheij F. J, Wiesman R. D.    Benefits and problems of electronic information exchange as perceived by health    care professionals: an interview study. BMC Health Services Research, 11:256.    Doi:10.1186/1472-6963-11-256. (2011).     </font>      <!-- ref --><P><font size="2" face="Verdana">5. Dalamagas T, Cheng T, Winkel K-J, Sellis T.    A. Methodology for Clustering XML Documents by Structure. Information Systems    (2006).     </font>      <!-- ref --><P><font size="2" face="Verdana">6. Dick R. S, Oteen E. B, Detmer D. E. (eds).    The computer-based patient record: An essential technology for health care.    Revised Edition Washington, D.C: The Nacional Academy Press. 1997. Cap&iacute;tulo    2. p. 74-99. </font><font size="2" face="verdana">[citado 2002 dic 14]</font>.    <font size="2" face="Verdana">Disponible en: <a href="http://books.nap.edu/books/0309055326/html/R1.html" target="_blank">http://books.nap.edu/books/0309055326/html/R1.html</a></font>      <!-- ref --><P><font size="2" face="Verdana">7. G&eacute;rvas J. La historia cl&iacute;nica    electr&oacute;nica: muchas promesas y pocos hechos. Aten Primaria. 2008;40(Supl    1):13.     </font>      <!-- ref --><P><font size="2" face="Verdana">8. Guerrini G, Mesiti M, Sanz I. An Overview    of Similarity Measures for Clustering XML Documents. 2006.     </font>      <!-- ref --><P><font size="2" face="Verdana">9. Wilde E, Glushko R.J. XML fever. Comm. ACM,    2008. 51(7): p. 40-46. doi: 10.1145/1364782.1364795.     </font>      <!-- ref --><P><font size="2" face="Verdana">10. Wang G. RPE query processing and optimization    techniques for XML databases. J. Comput. Sci. Technol, 2004. 19(2): p. 224-237.        </font>      <!-- ref --><P><font size="2" face="Verdana">11. Bertino E, Ferrari E. XML and data integration.    IEEE Internet Comput, 2001. 5(6): p. 75-76. doi: 10.1109/4236.968835.     </font>      <!-- ref --><P><font size="2" face="Verdana">12. Algergawy A. XML Data Clustering: An Overview,    in ACM Computing Surveys. 2011. doi: 10.1145/1978802.1978804.     </font>      <!-- ref --><P><font size="2" face="Verdana">13. Kruse R, D&ouml;ring C, Lesor M.-J. Fundamentals    of Fuzzy Clustering, in Advances in Fuzzy Clustering and its Applications, J.V.d.    Oliveira and W. Pedrycz, Editors. 2007, John Wiley and Sons: Est Sussex, England.    p. 3-27.     </font>      <!-- ref --><P><font size="2" face="Verdana">14. Ji T, Bao X, Yang D. FXProj - A Fuzzy XML    Documents Projected Clustering Based on Structure and Content. LNAI 7120, 2011:    p. 406-419.     </font>      <!-- ref --><P><font size="2" face="Verdana">15. Yousuke W, Hidetaka K , Haruo Y. Similarity    search for office XML documents based on style and structure data. International    Journal of Web Information Systems, 2013. 9(2): p. 100-117. doi: 10.1108/IJWIS-03-20    13-0005.     </font>      <!-- ref --><P><font size="2" face="Verdana">16. Kaufman L, Rousseeuw P.J. Finding groups    in data: an introduction to cluster analysis. Wiley Series in probability and    mathematical statistics. 1990: John Wiley and Sons.     </font>      <!-- ref --><P><font size="2" face="Verdana">17. Mart&iacute;n C. Aprendizaje Autom&aacute;tico    Y Miner&iacute;a De Datos Con Modelos Gr&aacute;ficos Probababil&iacute;sticos.    DEA, Universidad De Granada. 2007.     </font>      <!-- ref --><P><font size="2" face="Verdana">18. Tekli J.M, Chbeir R. A Novel XML Document    Structure Comparison Framework based-on Subtree Commonalities and Label Semantics.    Elsevier, 2011. doi: 10.1016/j.websem.2011.10.002.     </font>      <!-- ref --><P><font size="2" face="Verdana">19. Pinto D, Tovar M, Vilari&ntilde;o D . BUAP:    Performance of K-Star at the INEX'09 Clustering Task. In INEX 2009 Workshop    Pre-proceedings. 2009. Woodlands of Marburg, Ipswich, Queensland,Australia.    doi: 10.1007/978-3-642-14556-8_43.     </font>      <!-- ref --><P><font size="2" face="Verdana">20. Vries C. Overview of the INEX 2010 XML mining    track: clustering and classification of XML documents. In Lecture Notes in Computer    Science, Springer: Amsterdam. 2011.     </font>      <!-- ref --><P><font size="2" face="Verdana">21. Kurgan L, Swiercz W, Cios K.J. Semantic mapping    of xml tags using inductive machine learning. In 11th International Conference    on Information and Knowledge Management. 2002. Virginia, USA.     </font>      <!-- ref --><P><font size="2" face="Verdana">22. Shin K, Han S.Y. Fast clustering algorithm    for information organization. In: Proc. of the CICLing Conference. 2003, Lecture    Notes in Computer Science.Springer-Verlag (2003). p. 619-622. doi: 10.1007/3-540-36456-0_69.        </font>      <!-- ref --><P><font size="2" face="Verdana">23. MacQueen J.B. Some methods for classification    and analysis of multivariate observations. In Proc. 5th Berkeley Symposium on    Mathematical Statistics and Probability. 1967: Berkeley, University of California.    p. 281-297.     </font>      <!-- ref --><P><font size="2" face="Verdana">24. Sim I, Gorman P, Greenes R. A, Haynes R.    B, Kaplan B, Lehmann H, Tang P. C. Clinical decision support systems for the    practice of evidence-based medicine. J. Am Med Inform Assoc 2001; 8: 527-34.        </font>      <!-- ref --><P><font size="2" face="Verdana">25. Xiong H. J, Chen K. K-means clustering versus    validation measures: a data distribution perspective. In Proceedings of the    12th ACM SIGKDD international conference on Knowledge discovery and data mining    (KDD 2006). 2006. Philadelphia, PA, USA: ACM Press. doi: 10.1109/TSMCB.2008.2004559.        </font>      <!-- ref --><P><font size="2" face="Verdana">26. Costa G. Hierarchical clustering of XML documents    focused on structural components. Data &amp; Knowledge Engineering, 2013. 84:    p. 26-46. doi: 10.1016/j.datak.2012.12.002.     </font>      <!-- ref --><P><font size="2" face="Verdana">27. Magdaleno D, Fuente sI.E, Garc&iacute;a M.M.    Clustering XML Documents using Structure and Content Based in a Proposal Similarity    Function (OverallSimSUX). Computaci&oacute;n y Sistemas. 2015.     </font>      <P>&nbsp;     ]]></body>
<body><![CDATA[<P>&nbsp;     <P><font size="2" face="Verdana">Recibido: 22 de marzo de 2016.    <br>   Aprobado: 12 de mayo de 2016.</font>       ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Engelbrecht]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[K4Health. Knowledge for Health. Integrating EHR and Knowledge for better health care. Status of the EoI and work items]]></source>
<year></year>
<publisher-loc><![CDATA[Berlin ]]></publisher-loc>
<publisher-name><![CDATA[EUROREC]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brau]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[Extensible Markup Language(XML) 1.0., in W3C Recommendation]]></source>
<year>1998</year>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Raghan]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Schütze]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Information Retrieval]]></source>
<year>2008</year>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zwaanswijk]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Verheij]]></surname>
<given-names><![CDATA[F. J]]></given-names>
</name>
<name>
<surname><![CDATA[Wiesman]]></surname>
<given-names><![CDATA[R. D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Benefits and problems of electronic information exchange as perceived by health care professionals: an interview study]]></article-title>
<source><![CDATA[BMC Health Services Research]]></source>
<year>2011</year>
<volume>11</volume>
<numero>256</numero>
<issue>256</issue>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dalamagas]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Cheng]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Winkel]]></surname>
<given-names><![CDATA[K-J]]></given-names>
</name>
<name>
<surname><![CDATA[Sellis]]></surname>
<given-names><![CDATA[T. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Methodology for Clustering XML Documents by Structure. Information Systems]]></source>
<year>2006</year>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dick]]></surname>
<given-names><![CDATA[R. S]]></given-names>
</name>
<name>
<surname><![CDATA[Oteen]]></surname>
<given-names><![CDATA[E. B]]></given-names>
</name>
<name>
<surname><![CDATA[Detmer]]></surname>
<given-names><![CDATA[D. E]]></given-names>
</name>
</person-group>
<source><![CDATA[The computer-based patient record: An essential technology for health care]]></source>
<year>1997</year>
<page-range>74-99</page-range><publisher-loc><![CDATA[Washington, D.C ]]></publisher-loc>
<publisher-name><![CDATA[The Nacional Academy Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gérvas]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[La historia clínica electrónica: muchas promesas y pocos hechos]]></article-title>
<source><![CDATA[Aten Primaria]]></source>
<year>2008</year>
<volume>40</volume>
<numero>^s1</numero>
<issue>^s1</issue>
<supplement>1</supplement>
<page-range>13</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guerrini]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Mesiti]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Sanz]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<source><![CDATA[An Overview of Similarity Measures for Clustering XML Documents]]></source>
<year>2006</year>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wilde]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Glushko]]></surname>
<given-names><![CDATA[R.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[XML fever. Comm]]></article-title>
<source><![CDATA[ACM]]></source>
<year>2008</year>
<volume>51</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>40-46</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RPE query processing and optimization techniques for XML databases]]></article-title>
<source><![CDATA[J. Comput. Sci. Technol]]></source>
<year>2004</year>
<volume>19</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>224-237</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bertino]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Ferrari]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[XML and data integration]]></article-title>
<source><![CDATA[IEEE Internet Comput]]></source>
<year>2001</year>
<volume>5</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>75-76</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Algergawy]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[XML Data Clustering: An Overview, in ACM Computing Surveys]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kruse]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Döring]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Lesor]]></surname>
<given-names><![CDATA[M.-J]]></given-names>
</name>
</person-group>
<source><![CDATA[Fundamentals of Fuzzy Clustering, in Advances in Fuzzy Clustering and its Applications, J.V.d.]]></source>
<year>2007</year>
<page-range>3-27</page-range><publisher-loc><![CDATA[Est Sussex ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley and Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ji]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Bao]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Yang]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[FXProj - A Fuzzy XML Documents Projected Clustering Based on Structure and Content]]></source>
<year>2011</year>
<page-range>406-419</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yousuke]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Hidetaka]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Haruo]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Similarity search for office XML documents based on style and structure data]]></article-title>
<source><![CDATA[International Journal of Web Information Systems]]></source>
<year>2013</year>
<volume>9</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>100-117</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kaufman]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Rousseeuw]]></surname>
<given-names><![CDATA[P.J]]></given-names>
</name>
</person-group>
<source><![CDATA[Finding groups in data: an introduction to cluster analysis. Wiley Series in probability and mathematical statistics]]></source>
<year>1990</year>
<publisher-name><![CDATA[John Wiley and Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martín]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Aprendizaje Automático Y Minería De Datos Con Modelos Gráficos Probababilísticos]]></source>
<year>2007</year>
<publisher-name><![CDATA[Universidad De Granada]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tekli]]></surname>
<given-names><![CDATA[J.M]]></given-names>
</name>
<name>
<surname><![CDATA[Chbeir]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[A Novel XML Document Structure Comparison Framework based-on Subtree Commonalities and Label Semantics]]></source>
<year>2011</year>
<publisher-name><![CDATA[Elsevier]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pinto]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Tovar]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Vilariño]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[BUAP: Performance of K-Star at the INEX'09 Clustering Task]]></article-title>
<collab>INEX</collab>
<source><![CDATA[]]></source>
<year>2009</year>
<publisher-loc><![CDATA[Queensland ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vries]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Overview of the INEX 2010 XML mining track: clustering and classification of XML documents]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Amsterdam ]]></publisher-loc>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kurgan]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Swiercz]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Cios]]></surname>
<given-names><![CDATA[K.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Semantic mapping of xml tags using inductive machine learning]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[11 International Conference on Information and Knowledge Management.]]></conf-name>
<conf-date>2002</conf-date>
<conf-loc>Virginia </conf-loc>
</nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shin]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Han]]></surname>
<given-names><![CDATA[S.Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast clustering algorithm for information organization]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science.Springer-Verlag (2003)]]></source>
<year>2003</year>
<page-range>619-622</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MacQueen]]></surname>
<given-names><![CDATA[J.B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Some methods for classification and analysis of multivariate observations]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[5 Berkeley Symposium on Mathematical Statistics and Probability]]></conf-name>
<conf-date>1967</conf-date>
<conf-loc>Berkeley </conf-loc>
<page-range>281-297</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sim]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Gorman]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Greenes]]></surname>
<given-names><![CDATA[R. A]]></given-names>
</name>
<name>
<surname><![CDATA[Haynes]]></surname>
<given-names><![CDATA[R. B]]></given-names>
</name>
<name>
<surname><![CDATA[Kaplan]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Lehmann]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Tang]]></surname>
<given-names><![CDATA[P. C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Clinical decision support systems for the practice of evidence-based medicine]]></article-title>
<source><![CDATA[J. Am Med Inform Assoc]]></source>
<year>2001</year>
<volume>8</volume>
<page-range>527-34</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xiong]]></surname>
<given-names><![CDATA[H. J]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[K-means clustering versus validation measures: a data distribution perspective]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[12 ACM SIGKDD international conference on Knowledge discovery and data mining (KDD 2006).]]></conf-name>
<conf-date>2006</conf-date>
<conf-loc>Philadelphia </conf-loc>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Costa]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hierarchical clustering of XML documents focused on structural components]]></article-title>
<source><![CDATA[Data & Knowledge Engineering]]></source>
<year>2013</year>
<volume>84</volume>
<page-range>26-46</page-range></nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Magdaleno]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Fuente]]></surname>
<given-names><![CDATA[sI.E]]></given-names>
</name>
<name>
<surname><![CDATA[García]]></surname>
<given-names><![CDATA[M.M]]></given-names>
</name>
</person-group>
<source><![CDATA[Clustering XML Documents using Structure and Content Based in a Proposal Similarity Function (OverallSimSUX). Computación y Sistemas]]></source>
<year>2015</year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
