<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992013000300002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Modelación y manejo de bases de datos para el almacenamiento de la información sobre ortología genética]]></article-title>
<article-title xml:lang="en"><![CDATA[Modeling and management of databases for storing information about genetic orthology]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[de la Rosa Martín]]></surname>
<given-names><![CDATA[Tonysé]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Galpert Cañizares]]></surname>
<given-names><![CDATA[Deborah]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pupo Meriño]]></surname>
<given-names><![CDATA[Mario]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Central Marta Abreu de las Villas  ]]></institution>
<addr-line><![CDATA[Villa Clara ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Departamento de Informatización De Entidades ]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2013</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2013</year>
</pub-date>
<volume>7</volume>
<numero>3</numero>
<fpage>14</fpage>
<lpage>22</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992013000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992013000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992013000300002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La presente investigación tiene como precedente la necesidad de crear bases de datos locales para el almacenamiento de información referente a la ortología genética y secuencias genómicas de especies para el posterior estudio de éstas por los investigadores del Centro de Estudios de Informática (CEI) de la Universidad Central “Marta Abreu” de las Villas (UCLV). En la investigación se obtiene una aplicación informática desarrollada a partir de tecnologías libres que integra los procesos de validación e incorporación de información a partir de ficheros XML (Lenguaje de marcado extendido, por sus siglas en inglés) de secuencias genómicas y de información ortológica, así como la creación de distintos tipos de ficheros utilizados por otras aplicaciones dentro del área de la Bioinformática. Se incluye el estudio de las tecnologías y herramientas necesarias para el diseño e implementación de las bases de datos creadas con este fin, así como de la aplicación informática para el manejo de la información contenida en estas bases de datos. Se presenta la prueba del sistema en cuanto a su correcto funcionamiento, evidenciando que la utilización del mismo contribuirá a la disminución de las dificultades del uso de aplicaciones de manejo de ortología en internet por el tiempo de procesamiento y descarga de datos de gran volumen.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This previous research arise under the need to create their own databases for storing information regarding the orthology genetic and genomic sequences of species for further study of researchers at the Center of Informatics Studies (CIS) of the "Martha Abreu" Central University of Las Villas (UCLV). This investigation presents the results of the design and implementation of two databases from free technologies that integrate validation processes and incorporation of information from XML files genomic sequences and ortological information. To achieve the objectives outlined above study of technologies and tools for the design and implementation of databases created for this purpose, as well as the application for the management of the information contained in these databases. Evidence is presented in terms of the system function properly, showing that the use of it will help to reduce the difficulties of using orthology handling applications online by processing time and download large data volume.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Ortología genética]]></kwd>
<kwd lng="es"><![CDATA[Bases de datos biológicas]]></kwd>
<kwd lng="es"><![CDATA[Ficheros XML]]></kwd>
<kwd lng="es"><![CDATA[Ficheros orthoXML]]></kwd>
<kwd lng="es"><![CDATA[Ficheros seqXML]]></kwd>
<kwd lng="en"><![CDATA[Genetic Orthology]]></kwd>
<kwd lng="en"><![CDATA[Biological Databases]]></kwd>
<kwd lng="en"><![CDATA[XML Files]]></kwd>
<kwd lng="en"><![CDATA[orthoXML Files]]></kwd>
<kwd lng="en"><![CDATA[seqXML Files]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO    ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="4"><b>Modelaci&oacute;n    y manejo de bases de datos para el almacenamiento de la informaci&oacute;n sobre    ortolog&iacute;a gen&eacute;tica </b></font></p>     <p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><b><font size="3">Modeling    and management of databases for storing information about genetic orthology    </font></b> </font>      <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><b><font size="2">Tonys&eacute;    de la Rosa Mart&iacute;n<sup>1</sup>, Deborah Galpert Ca&ntilde;izares<sup>2</sup>,    Mario Pupo Meri&ntilde;o<sup>2</sup></font></b> </font>      <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup> Universidad    de las Ciencias Inform&aacute;ticas, Carretera a San Antonio de los Ba&ntilde;os,    km 2 &frac12;, Torrens, Boyeros, La Habana, Cuba. C.P.: 19370. E-mail. <a href="mailto:ajardines@uci.cu">ajardines@uci.cu</a>    <br>   <sup>2</sup> Universidad Central “Marta Abreu” de las Villas. Carretera a Camajuan&iacute;    km 3&frac12;. Santa Clara, Villa Clara. Cuba. E-mail. <a href="mailto:deborah@uclv.edu.cu">deborah@uclv.edu.cu</a>    ]]></body>
<body><![CDATA[<br>   <sup>3 </sup>Departamento de Informatizaci&oacute;n De Entidades, CEIGE, UCI,    La Habana, Cuba. E-mail. </font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:mpupo@uclv.edu.cu"><font size="2">mpupo@uclv.edu.cu    </font></a></font>      <P>&nbsp;      <P>&nbsp;  <hr>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>RESUMEN</B></font>      <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> La presente investigaci&oacute;n    tiene como precedente la necesidad de crear bases de datos locales para el almacenamiento    de informaci&oacute;n referente a la ortolog&iacute;a gen&eacute;tica y secuencias    gen&oacute;micas de especies para el posterior estudio de &eacute;stas por los    investigadores del Centro de Estudios de Inform&aacute;tica (CEI) de la Universidad    Central “Marta Abreu” de las Villas (UCLV). En la investigaci&oacute;n se obtiene    una aplicaci&oacute;n inform&aacute;tica desarrollada a partir de tecnolog&iacute;as    libres que integra los procesos de validaci&oacute;n e incorporaci&oacute;n    de informaci&oacute;n a partir de ficheros XML (Lenguaje de marcado extendido,    por sus siglas en ingl&eacute;s) de secuencias gen&oacute;micas y de informaci&oacute;n    ortol&oacute;gica, as&iacute; como la creaci&oacute;n de distintos tipos de    ficheros utilizados por otras aplicaciones dentro del &aacute;rea de la Bioinform&aacute;tica.    Se incluye el estudio de las tecnolog&iacute;as y herramientas necesarias para    el dise&ntilde;o e implementaci&oacute;n de las bases de datos creadas con este    fin, as&iacute; como de la aplicaci&oacute;n inform&aacute;tica para el manejo    de la informaci&oacute;n contenida en estas bases de datos. Se presenta la prueba    del sistema en cuanto a su correcto funcionamiento, evidenciando que la utilizaci&oacute;n    del mismo contribuir&aacute; a la disminuci&oacute;n de las dificultades del    uso de aplicaciones de manejo de ortolog&iacute;a en internet por el tiempo    de procesamiento y descarga de datos de gran volumen.</font>      <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Palabras clave:    </B> Ortolog&iacute;a gen&eacute;tica, Bases de datos biol&oacute;gicas, Ficheros    XML, Ficheros orthoXML, Ficheros seqXML.</font>  <hr> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ABSTRACT</b></font>      <P> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"> <em>T</em>his    previous research arise under the need to create their own databases for storing    information regarding the orthology genetic and genomic sequences of species    for further study of researchers at the Center of Informatics Studies (CIS)    of the &quot;Martha Abreu&quot; &nbsp; Central University &nbsp;of Las Villas    (UCLV). This investigation presents the results of the design and implementation    of two databases from free technologies that integrate validation processes    and incorporation of information from XML files genomic sequences and ortological    information. To achieve the objectives outlined above study of technologies    and tools for the design and implementation of databases created for this purpose,    as well as the application for the management of the information contained in    these databases. Evidence is presented in terms of the system function properly,    showing that the use of it will help to reduce the difficulties of using orthology    handling applications online by processing time and download large data volume.    </font>      <P> <font size="2" face="Verdana, Arial, Helvetica, sans-serif"><B>Key words:    </B> Genetic Orthology, Biological Databases, XML Files, orthoXML Files, seqXML    Files .</font>  <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>INTRODUCCI&Oacute;N</b></font>  </p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El mundo se mueve    desde el &uacute;ltimo medio siglo inmerso en una &eacute;poca que tradicionalmente    ha sido llamada la era de la Ciencia, y la sociedad de tal era no puede comprenderse    sin destacar una de esas m&uacute;ltiples disciplinas cient&iacute;ficas, que    sin duda, es y ser&aacute; un referente para la investigaci&oacute;n futura:    la Bioinform&aacute;tica. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La Bioinform&aacute;tica,    llamada tambi&eacute;n Biolog&iacute;a Molecular Computacional, corresponde    como tal a una disciplina cient&iacute;fica que utiliza tecnolog&iacute;a de    la informaci&oacute;n para organizar, analizar y distribuir informaci&oacute;n    de Biomol&eacute;culas con la finalidad de responder preguntas complejas (Altschul,    Boguski, Gish, &amp; Wootton, 1994). Representando as&iacute; una respuesta    alternativa y eficaz a los nuevos problemas en materia de salud que surgen en    la sociedad actual. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Nos encontramos    en el per&iacute;odo post-genoma humano conocido tambi&eacute;n como per&iacute;odo    de las &oacute;micas: la Gen&oacute;mica, la Prote&oacute;mica, la Metabol&oacute;mica    y la Cit&oacute;mica, que conllevan una gran cantidad de datos a analizar. La    secuenciaci&oacute;n masiva de genomas, la determinaci&oacute;n de estructuras    de prote&iacute;nas, el seguimiento, la expresi&oacute;n de miles de genes de    manera simult&aacute;nea, la determinaci&oacute;n de interacciones entre prote&iacute;nas    y el estudio sistem&aacute;tico de las modificaciones post-traduccionales de    prote&iacute;nas separadas en genes 2-D y caracterizadas por espectrometr&iacute;a    de masas llevan a generar insospechados datos, de los que se conocen propiedades    globales, pero no en detalle (Mart&iacute;nez, 2010). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De ah&iacute; que    el protagonismo de la Bioinform&aacute;tica est&aacute; dado por dos razones    principales: la primera es que la enorme cantidad de datos de origen biol&oacute;gico    s&oacute;lo puede ser analizada utilizando computadoras; la segunda es que los    datos no est&aacute;n tan comprensibles y las informaciones s&oacute;lo pueden    salir a la luz utilizando sofisticados algoritmos computacionales. Por lo tanto    el almacenamiento depurado, control y mantenimiento de estos datos con fines    espec&iacute;ficos como: el dise&ntilde;o de nuevos f&aacute;rmacos, comparaci&oacute;n    entre especies por su semejanza g&eacute;nica, entre otras es muy importante    para los cient&iacute;ficos e investigadores que trabajan en esta disciplina.    En este sentido, en el pa&iacute;s se han creado un grupo de instituciones dedicadas    permanentemente al desarrollo de la Bioinform&aacute;tica y que han adquirido    cierta madurez y experiencia en este campo. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como centro de    gran val&iacute;a y aporte cient&iacute;fico en esta rama se encuentra el Centro    de Estudios de Inform&aacute;tica (CEI) de la Universidad Central “Marta Abreu”    de las Villas, el cual cuenta con un Laboratorio de Bioinform&aacute;tica en    el que se realizan diversos estudios en materia de: Inteligencia Artificial    aplicada a la Bioinform&aacute;tica, elaboraci&oacute;n de &aacute;rboles filogen&eacute;ticos    y estudios sobre Homolog&iacute;a biol&oacute;gica. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La homolog&iacute;a    biol&oacute;gica no es m&aacute;s que: la relaci&oacute;n que existe entre dos    partes org&aacute;nicas diferentes cuando sus determinantes gen&eacute;ticos    tienen el mismo origen evolutivo. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los estudios han    definido dos formas de homolog&iacute;a: </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; homolog&iacute;a    primaria es el que implica un investigador, que afirma una creencia de que dos    personajes comparten un linaje. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; homolog&iacute;a    secundaria est&aacute; implicada por el an&aacute;lisis de parsimonia, conocido    tambi&eacute;n como m&eacute;todo de ponderaci&oacute;n y medida, donde se toma    un car&aacute;cter que s&oacute;lo se produce una vez en un &aacute;rbol para    ser hom&oacute;logo (Pinna, 1991) . </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al igual que con    las estructuras anat&oacute;micas, la homolog&iacute;a entre secuencias de prote&iacute;nas    o de ADN se define en t&eacute;rminos de ascendencia compartida. Dos segmentos    de ADN pueden haber compartido ancestros ya sea por una especiaci&oacute;n (ort&oacute;logos)    o un evento de duplicaci&oacute;n (par&aacute;logos) (Koonin, 2005). En la <a href="#f01">figura    1</a> se muestra una imagen en la que se ejemplifica c&oacute;mo a partir del    proceso de especiaci&oacute;n, el gen A es copiado tanto en el genoma de la    especie 1 como en el genoma de la especie 2, convirti&eacute;ndose de esta manera    en genes ort&oacute;logos. En la especie 1 a trav&eacute;s de un proceso de    duplicaci&oacute;n del gen A se obtienen dos genes, un nuevo gen B y el mismo    A, convirti&eacute;ndose de esta forma el gen B en entidad de tipo par&aacute;loga    respecto a el nuevo gen A y este mismo gen B se convierte en entidad de tipo    hom&oacute;loga respecto al gen A de la especie 2.</font> </p>     <p align="center"><font face="Verdana, Arial, Helvetica, sans-serif"><a name="f01"></a><img src="/img/revistas/rcci/v7n3/f0102313.png" width="515" height="354"></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El estudio de estos    grupos de genes es sumamente importante para el descubrimiento de funciones    semejantes en diferentes especies y as&iacute; la comprensi&oacute;n de las    mismas, con el fin de obtener patrones evolutivos tan necesarios en la predicci&oacute;n    y prevenci&oacute;n de enfermedades patol&oacute;gicas y gen&eacute;ticas. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El estudio de los    grupos de ortolog&iacute;a genera una gran cantidad de datos que deben ser almacenados    para posteriores estudios, por lo que el almacenamiento de los mismos, de manera    segura es muy importante para que puedan ser consultados y utilizados por otros    investigadores afines a la rama de la gen&oacute;mica tanto del CEI como de    la Comunidad Cient&iacute;fica del pa&iacute;s. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Actualmente, existe    un gran n&uacute;mero de cient&iacute;ficos y especialistas que realizan estudios    sobre la creaci&oacute;n de algoritmos y t&eacute;cnicas para obtener grupos    de ortolog&iacute;as entre especies, para ser almacenados en grandes bancos    de datos. Estas bases de datos son necesarias para comprobar el comportamiento    de nuevos algoritmos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Es importante mencionar    que las aplicaciones m&aacute;s avanzadas son comerciales o de propiedad de    compa&ntilde;&iacute;as privadas. La obtenci&oacute;n de informaci&oacute;n    de estas bases de datos requiere del uso intensivo de internet de alta velocidad    por el volumen de informaci&oacute;n que manejan. Existe una gran variedad de    formatos de los datos tanto en XML como en otras representaciones propias. Algunas    aplicaciones disponibles en Internet se han suscrito al proyecto SeqXML-OrthoXML    (Schmitt, 2011) como v&iacute;a de estandarizaci&oacute;n de la informaci&oacute;n    de ortolog&iacute;a. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En algunas investigaciones    no es conveniente divulgar la estructura de informaci&oacute;n, por lo que muchas    empresas o grupos de investigaci&oacute;n prefieren usar localmente estas bases    de datos. Es por esto que investigadores del Centro de Estudios Inform&aacute;ticos    (CEI) de la UCLV identificaron la necesidad de contar con una base de datos    propia para el almacenamiento de la informaci&oacute;n de grupos de ortolog&iacute;a    entre especies y de las secuencias relativas a estas. Tambi&eacute;n el poseer    un desarrollo propio en el almacenamiento de los datos tiene la ventaja de poder    incorporar nuevas ideas y algoritmos que se deriven de los distintos procesos    investigativos. </font></p>     <P>&nbsp;</p>     <P><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><B> Materiales    y m&eacute;todos</B></font>      <P> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el mundo existen    muchas bases de datos dedicadas a la recopilaci&oacute;n, mejoramiento y an&aacute;lisis    de la ortolog&iacute;a gen&eacute;tica como son: por ejemplo, en eucariotas    OrthoMCL (Li, Stoeckert, &amp; Roos, 2012), en mam&iacute;feros OrthoMaM (Biomed,    2012) , en plantas OrthologID (Oxford, 2011) y GreenPhylDB (Oxford, 2012) .    Otras referenciadas son:</font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Ensembl    Compara * (Instituto de Bioinform&aacute;tica Europeo). </font>      <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; InParanoid    *(Centro de Bioinform&aacute;tica de Estocolmo). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; MBGD    Microbial Genome Database. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; MGD    Mouse Genome Database. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; OMA*    (Proyecto Matrices de Ortolog&iacute;a, Zurich, Suiza). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; OrthoInspector.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; OrthoMCL.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Panther.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; PHOG.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; PhyloFacts.    </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; PhylomeDB.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; ProGMap.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Roundup *(Universidad    de Harvard) (Stockholm Bioinformatics Center, 2008). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sucede que muy    pocas de ellas brindan la informaci&oacute;n almacenada y casi ninguna el dise&ntilde;o    o la estructura de estas. De las anteriores solo las marcadas con * brindan    su informaci&oacute;n en ficheros de tipo XML (los cuales no poseen un manejo    simple para los especialistas). Estos ficheros XML conocidos como orthoXML contienen    las relaciones entre grupos de genes ort&oacute;logos de dos o m&aacute;s especies    especificadas (Stockholm Bioinformatics Center, 2011) y los seqXML (Stockholm    Bioinformatics Center, 2008) contienen las secuencias de ADN de los genes de    una especie determinada. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para realizar este    trabajo se ha filtrado la informaci&oacute;n de los ficheros OrthoXML utilizando    el Grafico Escalable de Vectores (SVG) obtenido del proyecto OMA (Ortologic    Matrix) (Stockholm Bioinformatic Center, 2011). Por otra parte, la estructura    de los ficheros SeqXML es bastante sencilla aunque tiene algunos elementos que    son omitidos del dise&ntilde;o como las notas suplementarias y propiedades especiales    que son agregadas por los algoritmos, por lo dem&aacute;s su dise&ntilde;o se    realiz&oacute; en conformidad con los criterios de conformaci&oacute;n de los    grandes proyectos antes mencionados. El ordenamiento l&oacute;gico y estructurado    que se ha realizado de la informaci&oacute;n almacenada en los ficheros orthoXML    y SeqXML se muestran en la <a href="/img/revistas/rcci/v7n3/f0202313.png">figura    2</a> y <a href="/img/revistas/rcci/v7n3/f0302313.png">figura 3</a> respectivamente.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v7n3/f0202313.png">figura    2</a> se observa como el fichero OrthoXML posee las especies y cada una de estas    posee a su vez una base de datos donde se encuentran los identificadores de    los genes que conforman su genoma. Tambi&eacute;n los OrthoXML poseen los grupos    de ortolog&iacute;a, los cuales poseen los identificadores de los genes ort&oacute;logos,    la puntuaci&oacute;n que los algoritmos asignan a cada grupo y las propiedades    del grupo de ortolog&iacute;a. Los &iacute;ndices de los genes ort&oacute;logos    poseen la puntuaci&oacute;n de conformaci&oacute;n del algoritmo.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v7n3/f0302313.png">Figura    3</a> se observa como el fichero SeqXML posee las entradas y cada una de estas    posee a su vez una referencia a la base de datos de donde se extrajeron los    datos para la conformaci&oacute;n de las secuencias.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el dise&ntilde;o    e implementaci&oacute;n de las bases de datos solo se utilizaron tecnolog&iacute;as    y herramientas libres como: </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; El    Sistema Gestor de Bases de Datos PostgreSQL establecido tanto en el Polo Cient&iacute;fico    Cubano como en la normativa del estado cubano para el logro de la independencia    tecnol&oacute;gica. La versi&oacute;n que se usa del mismo es la 8.4. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; El    Visual Paradigm para UML (Lenguaje de Modelado Unificado), herramienta UML profesional    que soporta el ciclo de vida completo del desarrollo de software: an&aacute;lisis    y dise&ntilde;o orientados a objetos, construcci&oacute;n, pruebas y despliegue.    El software de modelado UML ayuda a una m&aacute;s r&aacute;pida construcci&oacute;n    de aplicaciones de calidad, mejores y a un menor coste. Permite dibujar todos    los tipos de diagramas de clases, c&oacute;digo inverso, generar c&oacute;digo    desde diagramas y generar documentaci&oacute;n, adem&aacute;s de crear los artefactos    necesarios para el modelado y creaci&oacute;n de bases de datos (Visual Paradigm,    2009) . </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; La    tecnolog&iacute;a Java 2 Enterprise Edition (J2EE) que proporciona una completa    y potente plataforma orientada al desarrollo de aplicaciones J2EE como plataforma    de desarrollo aporta numerosas bibliotecas y ambientes de trabajo, la mayor&iacute;a    de las cuales son gratuitas y de c&oacute;digo abierto. Adem&aacute;s esta tecnolog&iacute;a    es multiplataforma (Johnson, 2003). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; El    lenguaje Java que ofrece todas las ventajas de un lenguaje potente y robusto,    pues fue dise&ntilde;ado para crear software altamente fiable. Es un lenguaje    de programaci&oacute;n basado en clases y orientado a objetos. Sus caracter&iacute;sticas    de memoria liberan a los programadores de responsabilidades y errores. Java    es compilado en un c&oacute;digo intermedio m&aacute;s abstracto que el c&oacute;digo    de m&aacute;quina que es ejecutado por la m&aacute;quina virtual de Java (J2EE)    (Arnold, Gosling, &amp; Holmes, 2005). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; UML    (Unified Modeling Language), lenguaje que permite modelar, construir y documentar    los elementos que forman un sistema de software orientado a objetos. Se ha convertido    en el est&aacute;ndar de facto de la industria, debido a que ha sido impulsado    por los autores de los tres m&eacute;todos m&aacute;s usados de orientaci&oacute;n    a objetos: Grady Booch, Ivar Jacobson y Jim Rumbaugh (Rumbaugh, Jacobson, &amp;    Booch., 2004) . </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; NetBeans    IDE (Entorno integrado de desarrollo, por su siglas en ingl&eacute;s), herramienta    para que los programadores puedan escribir, compilar, depurar y ejecutar programas.    Est&aacute; escrito en Java. Existe adem&aacute;s un n&uacute;mero importante    de m&oacute;dulos para extender el NetBeans IDE. Este IDE es un producto libre    sin restricciones de uso y es de c&oacute;digo abierto y gratuito para uso tanto    comercial como no comercial. El c&oacute;digo fuente est&aacute; disponible    para su reutilizaci&oacute;n de acuerdo con la Licencia GPL (Licencia P&uacute;blica    General, por sus siglas en ingl&eacute;s) (Netbeans, 2009).</font> </p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el manejo    de las bases de datos OrthoXML y SeqXML se desarroll&oacute; una aplicaci&oacute;n    inform&aacute;tica para la inserci&oacute;n y manejo de informaci&oacute;n proveniente    de ficheros de secuencia (seqXML) y de ortolog&iacute;a gen&eacute;tica (orthoXML)    llamada Gregor. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La aplicaci&oacute;n    visual de este sistema Gregor tiene concebida toda la ejecuci&oacute;n de las    funcionalidades a partir de una arquitectura cliente-servidor, espec&iacute;ficamente    en la variante de tres capas, lo que tiene como objetivo compartir informaci&oacute;n    invirtiendo la menor cantidad de recursos. Debido a esto la informaci&oacute;n    que maneja el sistema inform&aacute;tico implementado se almacena centralmente    en las dos bases de datos anteriormente mencionadas, sin duplicaci&oacute;n    de informaci&oacute;n en ninguna de ellas. Los usuarios solo necesitan de una    computadora y de la red para utilizar el sistema. El sistema puede ser utilizado    por m&uacute;ltiples usuarios a la vez. Las pruebas realizadas al mismo demuestran    que pueden estar conectados al menos 40 usuarios a la vez sin que se afecte    la integridad y la capacidad de respuesta del sistema. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el dise&ntilde;o    e implementaci&oacute;n de las bases de datos del sistema se realiz&oacute;    un an&aacute;lisis a partir del Gr&aacute;fico Escalable de Vectores (SVG),    con el objetivo de determinar cu&aacute;l ser&iacute;a la mejor estructura para    la base de datos OrthoXML; obteni&eacute;ndose un dise&ntilde;o de menor complejidad    estructural que el de las bases de datos revisadas en internet, pues de las    m&aacute;s de 21 tablas, con ciclos incluidas en alguna de ellas (ejemplo las    del proyecto OMA) y la falta de completitud en campos importantes como es el    id del grupo de ortolog&iacute;a del proyecto RoundUP, el dise&ntilde;o de la    base de datos orthoXML qued&oacute; solamente en 13 tablas que recogen la informaci&oacute;n    relevante y necesaria para el desarrollo de esta investigaci&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El dise&ntilde;o    e implementaci&oacute;n de la base de datos de SeqXML por su escasa complejidad    estructural y estandarizaci&oacute;n a nivel mundial se hizo muy semejante a    los proyectos antes mencionados incluyendo en estos el Proyecto Inparanoid y    el ENSEMBL Compara. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La informaci&oacute;n    que se maneja en la aplicaci&oacute;n es p&uacute;blica, pero se mantiene en    un ambiente local con la seguridad correspondiente. La interfaz de usuario se    muestra en la <a href="/img/revistas/rcci/v7n3/f0402313.png">Figura 4</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El usuario puede    agregar los ficheros de las especies de tipo seqXML y orthoXML a las bases de    datos a trav&eacute;s de la opci&oacute;n Importar XML's. En la opci&oacute;n    Exportar ficheros el usuario puede obtener ficheros tipo FASTA y RoundUP a partir    de la informaci&oacute;n contenida en las bases de datos y en la Opci&oacute;n    Exportar obtener ficheros de m&aacute;s complejidad como son los de tipo ARFF    y SPSS. Las bases de datos SeqXML y OrthoXML han sido pobladas con la informaci&oacute;n    contenida en 1109 ficheros de tipo seqXML y 15 de tipo orthoXML de 28 especies.    </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Algunas ventajas    logradas con el dise&ntilde;o e implementaci&oacute;n de las bases de datos    son: </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Independencia    de Internet cuando se usa localmente en una instituci&oacute;n que as&iacute;    lo decida, aunque puede hacerse una herramienta p&uacute;blica que se acceda    desde la web. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Conexi&oacute;n    a una base de datos segura, solo accedida por usuarios espec&iacute;ficos a    trav&eacute;s del sistema Gregor. Esto posibilita que se mantenga la confiabilidad    de la informaci&oacute;n y se mantenga disponible siempre que se necesite. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Constituyen aportes    a considerar: </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; A    trav&eacute;s del sistema inform&aacute;tico implementado para el manejo de    las bases de datos creadas se entrega la posibilidad a los especialistas de    prescindir de las bases de datos p&uacute;blicas en internet, dado los inconvenientes    que conlleva conectarse a estas desde Cuba. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; A    partir de las bases de datos se crean un conjunto de funcionalidades dedicadas    a facilitar el trabajo de los especialistas en la rama de la ortolog&iacute;a    gen&eacute;tica, a la hora de usar otras aplicaciones como son WEKA, SPSS, etc.    </font></p> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los especialistas  cuentan con una base de datos, sin tener la necesidad de divulgar la informaci&oacute;n  de investigaciones propias y la creaci&oacute;n de nuevas ideas a partir de las  estructuras almacenadas. </font>      <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><B>CONCLUSIONES</B></font>  </p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la investigaci&oacute;n    se cre&oacute; una base de datos (OrthoXML) la cual mejora estructuralmente    la informaci&oacute;n obtenida a partir de los ficheros XML de distintos proyectos    dedicados a la conformaci&oacute;n y almacenamiento de grupos de ortolog&iacute;a    en internet. </font>      <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La base de datos    (SeqXML) implementada permite la creaci&oacute;n de ficheros de tipo .fasta    a partir de los ficheros XML de secuencia de los proyectos dedicados a la conformaci&oacute;n    de grupos de ortolog&iacute;a. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las funcionalidades    implementadas en la aplicaci&oacute;n visual (Gregor) permiten la conformaci&oacute;n    de ficheros de tipo FASTA, ARFF y SPSS, sirviendo de soporte a otras aplicaciones    de la rama de la Bioinform&aacute;tica. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El trabajo continuar&aacute;    con la incorporaci&oacute;n de nuevos datos procedentes de otras bases en Internet    y en la utilizaci&oacute;n de los mismos en las investigaciones. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><font size="3"><b>AGRADECIMIENTOS</b></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Al    grupo Biosoft del Centro DATEC de la Universidad de la Ciencias Inform&aacute;ticas.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&#149;&nbsp; Al    grupo de Bioinform&aacute;tica de la Universidad Central de las Villas “Marta    Abreu”.</font></p>     <P>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>      <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Altschul, S., Boguski,    M., Gish, W., &amp; Wootton, J. (1994). <em>Issues in searching molecular Sequence    databases. </em> Nat Genet. 6: P. 119-29 Revisado Noviembre 2011. </font>      <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Arnold, K., Gosling,    J., &amp; Holmes, D.<em>Java (TM) Programming Language. </em> The. Addison-Wesley    Professional. 2005.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Biomed, C.<em>BiomedCentral</em>.    Disponible en: [<a href="http://www.biomedcentral.com/" target="_blank">http://www.biomedcentral.com/</a>]    1471-2148/7/241: BMC Evol. Biol. 7: p. 241. 2012.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Johnson, R. <em>Expert    one-on-one J2EE Design and Development. </em>Wrox. 2003.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Koonin, E. <em>&quot;Ort&oacute;logos,    par&aacute;logos y la gen&oacute;mica evolutiva”. </em> Annu. Rev. Genet 39.    2005.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Li, L., Christian    J., S., &amp; David, S. R. <em>OrthoMCL-DB</em>. 2012. Disponible en: [<a href="http://www.orthomcl.org" target="_blank">http://www.orthomcl.org</a>].    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mart&iacute;nez,    J. <em>Funci&oacute;n e Importancia de la Bioinform&aacute;tica en el Desarrollo    de las Ciencias, Especialmente en Biotecnolog&iacute;a y MedicinaMolecular.    </em> Revisado Noviembre 2011. 2010.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Netbeans. <em>Netbeans</em>.    Retrieved Diciembre de 2011. 2009 [Consultado el: 20 de diciembre de 2011].    Disponible en: [<a href="www%20netbeans.org" target="_blank">www netbeans.org</a>].</font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Oxford,    U. <em>OrthologID</em>. 2011. Disponible en: [<a href="http://bioinformatics.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16410324" target="_blank">http://bioinformatics.oxfordjournals.org/cgi/pmidlookup?view=long&amp;pmid=16410324</a>]    : Bioinformatics 22 (6): pp. 699&ndash;707. doi:10.1093/bioinformatics/btk040.    PMID 16410324. </font></p>     ]]></body>
<body><![CDATA[<p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Oxford,    U. <em>GreenPhylDB</em>. 2012. Disponible en: [<a href="http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=17986457" target="_blank">http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&amp;pmid=17986457</a>]    : Nucleic Acids Res. 36 (Database issue): pp. D991&ndash;8. doi:10.1093/nar/gkm934.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Pinna, M. (1991).    <em>&quot;Conceptos y An&aacute;lisis de homolog&iacute;a en el Paradigma clad&iacute;stico&quot;    . </em>Cladistics 7 (4): p. 367-394.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Rumbaugh, J., Jacobson,    I., &amp; Booch., G. <em>Unified Modeling Language Reference Manual. </em> The    Pearson Higher Education. 2004.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Schmitt, T. <em>“Letter    to the Editor: SeqXML and OrthoXML: standards for sequence and orthology in-formation”.    </em> Briefings in Bioinformatics. 2011.    </font></p>     <P>&nbsp;</p>     <p>&nbsp; </p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 27/02/2013        <br>   Aceptado: 25/06/2013</font>      ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Altschul]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Boguski]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Gish]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Wootton]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Issues in searching molecular Sequence databases]]></article-title>
<source><![CDATA[Nat Genet]]></source>
<year>1994</year>
<volume>6</volume>
<page-range>119-29</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Arnold]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Gosling]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Holmes]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Java (TM) Programming Language]]></source>
<year>2005</year>
<publisher-name><![CDATA[The. Addison-Wesley Professional]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<collab>Biomed</collab>
<source><![CDATA[1471-2148/7/241]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Johnson]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<source><![CDATA[Expert one-on-one J2EE Design and Development]]></source>
<year>2003</year>
<publisher-name><![CDATA[Wrox]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Koonin]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Ortólogos, parálogos y la genómica evolutiva]]></article-title>
<source><![CDATA[Annu. Rev. Genet]]></source>
<year>2005</year>
<volume>39</volume>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Christian]]></surname>
<given-names><![CDATA[J. S.]]></given-names>
</name>
<name>
<surname><![CDATA[David]]></surname>
<given-names><![CDATA[S. R.]]></given-names>
</name>
</person-group>
<source><![CDATA[OrthoMCL-DB]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martínez]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Función e Importancia de la Bioinformática en el Desarrollo de las Ciencias, Especialmente en Biotecnología y MedicinaMolecular]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<collab>Netbeans</collab>
<source><![CDATA[Netbeans]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<collab>Oxford University</collab>
<article-title xml:lang="en"><![CDATA[OrthologID]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2011</year>
<volume>22</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>699-707</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<collab>Oxford University</collab>
<article-title xml:lang="en"><![CDATA[GreenPhylDB]]></article-title>
<source><![CDATA[Nucleic Acids Res]]></source>
<year>2012</year>
<volume>36</volume>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pinna]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Conceptos y Análisis de homología en el Paradigma cladístico]]></article-title>
<source><![CDATA[Cladistics]]></source>
<year>1991</year>
<volume>7</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>367-394</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rumbaugh]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Jacobson]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Booch]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[Unified Modeling Language Reference Manual]]></source>
<year>2004</year>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schmitt]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[SeqXML and OrthoXML: standards for sequence and orthology in-formation]]></source>
<year>2011</year>
<publisher-name><![CDATA[Briefings in Bioinformatics]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
