<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Sistema para la extracción de información de proteínas y péptidos]]></article-title>
<article-title xml:lang="en"><![CDATA[Information retrieval system for proteins and peptides]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Santiesteban-Toca]]></surname>
<given-names><![CDATA[Cosme E]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[López Aparicio]]></surname>
<given-names><![CDATA[Liuben]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Máximo Gómez Báez Centro de Bioplantas ]]></institution>
<addr-line><![CDATA[ Ciego de Ávila]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>09</fpage>
<lpage>20</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN El auge de las investigaciones en el área de las proteínas ha generado el desarrollo de grandes bases de datos en línea. El principal inconveniente de estas bases de datos es la descarga individual de las proteínas, lo cual se acrecienta con la dimensión de la búsqueda. Sin embargo, no se cuenta con una herramienta que extienda las funcionalidades de buscadores como PDBSelect, al análisis de las cadenas peptídicas y permita trabajar de forma conectada o desconectada al PDB. Por lo que en este artículo se presenta una herramienta que permite la búsqueda en cadenas peptídicas dentro del set de proteínas, así como de homologías entre proteínas y péptidos. Esta nueva herramienta facilita la selección y criba de proteínas, entre otras funciones de gran interés. Extendiendo las funcionalidades de PDBSelect, al permitir la búsqueda en cadenas peptídicas dentro del set de proteínas, así como de homologías entre proteínas y péptidos. La herramienta propuesta permite el trabajo de forma conectada o desconectada al PDB. El análisis de un caso de estudio permitió demostrar cómo, en apenas seis pasos sencillos, se logra obtener un conjunto de proteínas y subsecuencias peptídicas que permitan a los investigadores realizar posteriores investigaciones con estas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The rise of research in the area of proteins has led to the development of large online databases. The main drawback of these databases is the download of individual proteins, which increases with the size of the search. However, we don´t have tools capable to extend the functionalities of search engines like PDBSelect, with respect to peptidical chains analysis and allowing to work both online or offline. In this paper, we present a tool that enables the search of peptidical chains inside the set of proteins and homologies between proteins and peptides. This tool facilitates the selection and screening of protein, among other features of interest. Extending PDBSelect functionality by allowing the search of peptide chains within the set of proteins and search homologies between proteins and peptides. The tool can work online or offline with the PDB. The analysis of a case of study helped to show how, in just six easy steps, it is possible to obtain a set of protein and peptide subsequences that allow researchers to conduct further research with these.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Herramienta bioinformática]]></kwd>
<kwd lng="es"><![CDATA[búsqueda]]></kwd>
<kwd lng="es"><![CDATA[péptidos]]></kwd>
<kwd lng="es"><![CDATA[proteínas]]></kwd>
<kwd lng="es"><![CDATA[alineamiento de secuencias]]></kwd>
<kwd lng="es"><![CDATA[base de datos de proteínas]]></kwd>
<kwd lng="en"><![CDATA[Bioinformatics tool]]></kwd>
<kwd lng="en"><![CDATA[search]]></kwd>
<kwd lng="en"><![CDATA[peptides]]></kwd>
<kwd lng="en"><![CDATA[proteins]]></kwd>
<kwd lng="en"><![CDATA[sequences alignment]]></kwd>
<kwd lng="en"><![CDATA[proteins database]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Sistema  para la extracci&oacute;n de informaci&oacute;n de prote&iacute;nas y p&eacute;ptidos</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Information retrieval system  for proteins and peptides</em></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Cosme E. Santiesteban-Toca<strong><sup>1*</sup></strong>, Liuben L&oacute;pez Aparicio<strong><sup>1</sup></strong></font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Centro de Bioplantas, Universidad M&aacute;ximo G&oacute;mez B&aacute;ez,  Ciego de &Aacute;vila, Carretera a Mor&oacute;n, Km 9&frac12;, Cuba, {liuben, cosme}@bioplantas.cu</font><font size="2"></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br> </font></p>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:cosme@bioplantas.cu">cosme@bioplantas.cu</a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El auge de las investigaciones en el &aacute;rea de las prote&iacute;nas ha generado  el desarrollo de grandes bases de datos en l&iacute;nea. El principal inconveniente de  estas bases de datos es la descarga individual de las prote&iacute;nas, lo cual se  acrecienta con la dimensi&oacute;n de la b&uacute;squeda. Sin embargo, no se cuenta con una  herramienta que extienda las funcionalidades de buscadores como PDBSelect, al  an&aacute;lisis de las cadenas pept&iacute;dicas y permita trabajar de forma conectada o  desconectada al PDB. Por lo que en este art&iacute;culo se presenta una herramienta  que permite la b&uacute;squeda en cadenas pept&iacute;dicas dentro del set de prote&iacute;nas, as&iacute;  como de homolog&iacute;as entre prote&iacute;nas y p&eacute;ptidos. Esta nueva herramienta facilita  la selecci&oacute;n y criba de prote&iacute;nas, entre otras funciones de gran inter&eacute;s.  Extendiendo las funcionalidades de PDBSelect, al permitir la b&uacute;squeda en  cadenas pept&iacute;dicas dentro del set de prote&iacute;nas, as&iacute; como de homolog&iacute;as entre  prote&iacute;nas y p&eacute;ptidos. La herramienta propuesta permite el trabajo de forma  conectada o desconectada al PDB. El an&aacute;lisis de un caso de estudio permiti&oacute;  demostrar c&oacute;mo, en apenas seis pasos sencillos, se logra obtener un conjunto de  prote&iacute;nas y subsecuencias pept&iacute;dicas que permitan a los investigadores realizar  posteriores investigaciones con estas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Herramienta bioinform&aacute;tica, b&uacute;squeda, p&eacute;ptidos,  prote&iacute;nas, alineamiento de secuencias, base de datos de prote&iacute;nas.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The rise of research in the  area of proteins has led to the development of large online databases. The main  drawback of these databases is the download of individual proteins, which  increases with the size of the search. However, we don&acute;t have tools capable to  extend the functionalities of search engines like PDBSelect, with respect to  peptidical chains analysis and allowing to work both online or offline. In this  paper, we present a tool that enables the search of peptidical chains inside  the set of proteins and homologies between proteins and peptides. This tool facilitates  the selection and screening of protein, among other features of interest.  Extending PDBSelect functionality by allowing the search of peptide chains  within the set of proteins and search homologies between proteins and peptides.  The tool can work online or offline with the PDB. The analysis of a case of study  helped to show how, in just six easy steps, it is possible to obtain a set of  protein and peptide subsequences that allow researchers to conduct further  research with these.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Bioinformatics tool, search, peptides, proteins, sequences alignment,  proteins database.</font></p> <hr>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El desarrollo alcanzado por las  Ciencias Biol&oacute;gicas ha permitido la acumulaci&oacute;n de gran cantidad de informaci&oacute;n  experimental disponible en vastas bases de datos. El manejo e interpretaci&oacute;n de  estos vol&uacute;menes de informaci&oacute;n ha dado lugar al surgimiento de la  Bioinform&aacute;tica.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la actualidad existe una base de datos en l&iacute;nea de  estructuras de prote&iacute;nas y &aacute;cidos nucleicos nombrada <em>Protein Data Bank</em> (PDB) (Bi et&nbsp;al. 2015).  Esta base de datos cuenta con aproximadamente 65 mil prote&iacute;nas de estructura  conocida. Cuyo objetivo fundamental es mantener un archivo de datos de  estructuras macromoleculares disponible gratuita y p&uacute;blicamente para la  comunidad global.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Existen  m&uacute;ltiples bibliotecas y herramientas bioinform&aacute;ticas ampliamente difundidas,  destinadas al trabajo y la representaci&oacute;n de estructuras de prote&iacute;nas (Hirsh et&nbsp;al. 2015), (Colaert et&nbsp;al. 2013), (Sormanni et&nbsp;al. 2014), (Marchler-bauer et&nbsp;al. 2013), (Arnold, Bordoli y Schwede 2006), (Chandonia 2007), (Wu et&nbsp;al. 2007), (Stern et&nbsp;al.  2014) y (Wolstencroft  et&nbsp;al. 2013). En sentido general estas bibliotecas y  herramientas est&aacute;n dise&ntilde;adas para el trabajo con una prote&iacute;na a la vez o para  realizar los alineamientos tradicionales empleados, locales o globales, sin  atender a las relaciones que pudieran existir entre los p&eacute;ptidos de dichas  prote&iacute;nas y la actividad asociada a los mismos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De igual manera  existen m&uacute;ltiples bases de datos bien conocidas como: <em>Protein Data Bank</em> (Bi et&nbsp;al. 2015), (Consortium 2017), (Kiefer et&nbsp;al.  2009), (Hulo, N.; Amos, Bairoch; Bulliard, Virginie&#8239;; Cerutti, Lorenzo; De  Castro, Edouard; Langendijk-Genevaux, Petra S.; Pagni, Marco; Sigrist 2006), (Mitchell et&nbsp;al. 2015). Todas estas bases de datos se  encuentran en l&iacute;nea (on-line) y brindan potentes herramientas de b&uacute;squeda, que  son capaces de filtrar por nombre, clasificaci&oacute;n, caracter&iacute;sticas qu&iacute;micas,  motivos estructurales, funci&oacute;n, grado de identidad, organismos, etc&eacute;tera. Sin  embargo, tampoco est&aacute;n orientadas a la b&uacute;squeda de relaciones que pudieran  existir entre los p&eacute;ptidos de dichas prote&iacute;nas, ni permiten el trabajo  desconectado (off-line).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El sitio de PDB posee una potente herramienta de  b&uacute;squeda denominada <em>PDBSelect</em>, la  cual tiene como principal inconveniente la descarga individual de las  prote&iacute;nas, lo cual se acrecienta con la dimensi&oacute;n de la b&uacute;squeda. Sin embargo,  no se cuenta con una herramienta que extienda las funcionalidades de buscadores  como <em>PDBSelect</em>, al an&aacute;lisis de las  cadenas pept&iacute;dicas y permita trabajar de forma conectada o desconectada al PDB.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como parte del objetivo  fundamental de la presente investigaci&oacute;n, la herramienta deber&aacute; permitir la  b&uacute;squeda en cadenas pept&iacute;dicas dentro del set de prote&iacute;nas, as&iacute; como de  homolog&iacute;as entre prote&iacute;nas y p&eacute;ptidos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como resultado se propone una nueva  herramienta que facilita la selecci&oacute;n y criba de prote&iacute;nas y p&eacute;ptidos, entre  otras funciones de gran inter&eacute;s. Este art&iacute;culo est&aacute; conformado por una secci&oacute;n  de antecedentes, donde se analizan algunas de las herramientas bioinform&aacute;ticas  empleadas en la selecci&oacute;n y criba de prote&iacute;nas. La secci&oacute;n donde se muestra la  propuesta realizada. Una secci&oacute;n de validaci&oacute;n de los resultados donde se  muestra un caso de estudio y por ultimo las conclusiones y trabajos futuros. </font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el presente  art&iacute;culo se propone una herramienta que facilita la investigaci&oacute;n sobre la  actividad que pueda tener una prote&iacute;na o una determinada subsecuencia  pept&iacute;dica. Para ello se requiere que la herramienta creada sea capaz de  encontrar las subsecuencias que se repiten en diferentes prote&iacute;nas y la  relaci&oacute;n que existe entre la actividad de estas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Esta herramienta  brinda a los cient&iacute;ficos e investigadores la posibilidad de interactuar directa  o indirectamente con las bases de datos de prote&iacute;nas en busca de posibles  subsecuencias pept&iacute;dicas para su posterior s&iacute;ntesis y an&aacute;lisis.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El <strong>S</strong>istema <strong>J</strong>ava de <strong>R</strong>ecuperaci&oacute;n de <strong>I</strong>nformaci&oacute;n  de <strong>P</strong>rote&iacute;nas y <strong>P</strong>&eacute;ptidos (JIRP, por sus siglas en ingles), est&aacute; basado en la  biblioteca de clases <em>Bioinformatics</em>,  creada con el objetivo de extraer la informaci&oacute;n de las prote&iacute;nas contenidas en  el PDB, la realizaci&oacute;n de las b&uacute;squedas por subsecuencias pept&iacute;dicas, as&iacute; como  las interfaces necesarias para lograr la interoperabilidad entre las bases de  datos de prote&iacute;nas, las herramientas bioinform&aacute;ticas y los investigadores (<a href="/img/revistas/rcci/v11n3/f0102317.jpg" target="_blank">Figura  1</a>). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este proceso  se obtienen los genes con valores m&aacute;s centralizados y se eliminan los grupos  con valores extremos. Con los genes resultantes tras este proceso de selecci&oacute;n  se construye un nuevo <em>microarray</em> que  ser&aacute; sobre el que el algoritmo de inferencia realice la extracci&oacute;n de las redes  de genes.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Implementaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JIRP es una herramienta de escritorio desarrollada con Java y libre que  permite organizar el trabajo de investigaci&oacute;n asociado al manejo de prote&iacute;nas.  Esta herramienta ofrece un ambiente gr&aacute;fico para el dise&ntilde;o de b&uacute;squeda  altamente personalizada de prote&iacute;nas y de subsecuencias en las mismas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La aplicaci&oacute;n cuenta con una base de datos interna, que viabiliza el  proceso de b&uacute;squeda de y dentro de las prote&iacute;nas. Esto se logra a partir de la  extracci&oacute;n de las propiedades de las prote&iacute;nas derivadas tanto de su estructura  primaria, secundaria como terciarias. Adem&aacute;s, almacena las subsecuencias y sus  coincidencias, creando as&iacute; una base de datos de plantillas de p&eacute;ptidos  asociados a sus posibles actividades.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El sistema es capaz de leer prote&iacute;nas en formato *.pdb y *.ent, las cuales  pudieran encontrarse en ficheros compactados *.gz. La b&uacute;squeda de prote&iacute;nas se  realiza empleando los mismos criterios de <em>PDBSelect</em>,  extendiendo estos a esquemas de estructuras secundarias definidas por el  investigador. Estas b&uacute;squedas tambi&eacute;n se pueden realizar a partir de una  subsecuencias de amino&aacute;cidos previamente guardada por el investigador en la  base de datos, devolvi&eacute;ndole secuencias que tengan la misma funci&oacute;n o similar a  la que se utiliza como plantilla para la b&uacute;squeda. La b&uacute;squeda de secuencias  tambi&eacute;n se realiza seg&uacute;n criterios de hidrofobicidad en amino&aacute;cidos presentes  en dichas secuencias, as&iacute; como amino&aacute;cidos deseados o no.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La b&uacute;squeda a trav&eacute;s de estructuras secundarias definidas por el  investigador se simplifica a que plantee exactamente la forma de la  subsecuencia que desea encontrar en otras prote&iacute;nas, esta se trasforma en tiempo  de ejecuci&oacute;n a una expresi&oacute;n regular que se encarga de realizar las comparaciones  en la base de datos, teniendo como resultado las prote&iacute;nas coincidentes y similares.  De esta manera los investigadores no necesitan de los conocimientos de  inform&aacute;tica para tener &eacute;xito.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como complemento a este m&eacute;todo de b&uacute;squeda se encuentra un motor de  sugerencias basado en los posibles errores del investigador en el momento de  construir la expresi&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Otra caracter&iacute;stica importante del proceso de b&uacute;squeda es el empleo de  plantillas. Las cuales se basan en b&uacute;squedas previas que fueron guardadas en la  base de datos y cuya subsecuencia est&aacute; asociada a una actividad bien definida.  El empleo de dichas plantillas est&aacute; pensado en base a la eficiencia de las  b&uacute;squedas debido a que funcionan como un tipo de cache.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El uso de este m&eacute;todo tiene dos  aristas fundamentales porque de no encontrarse la plantilla adecuada se tendr&iacute;a  que proceder a realizar un parseo en toda la base de datos, lo cual se evitar&iacute;a  de aparecer, reduciendo notablemente el tiempo de b&uacute;squeda.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JIRP permite realizar alineamientos locales y globales lo que facilita la comparaci&oacute;n  de secuencias de prote&iacute;nas resaltando las zonas de similitud que podr&iacute;an  indicar relaciones funcionales o evolutivas entre las prote&iacute;nas seleccionadas. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A diferencia de las herramientas tradicionales, JIRP permite exportar las  prote&iacute;nas seleccionadas, por cualquiera de los m&eacute;todos anteriormente descritos,  hacia una carpeta o una nueva base de datos para realizar experimentaci&oacute;n  posterior con ellas. En caso que desee exportarlas en forma de fichero el  sistema busca la direcci&oacute;n de procedencia de las prote&iacute;nas e intenta copiarla  desde esta o las extrae directamente de la base de datos si desea exportar a  una base de datos nueva.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Base de datos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La aplicaci&oacute;n cuenta con una base de datos interna <em>SQLite</em>. En esta base de datos se gestionan una serie de &iacute;ndices  derivados de los metadatos extra&iacute;dos de los pdb que permiten al investigador  crear criterios de b&uacute;squeda personalizados y obtener la informaci&oacute;n organizada  seg&uacute;n su relevancia y cobertura.&nbsp; </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A medida que la aplicaci&oacute;n  indexa nuevas prote&iacute;nas la informaci&oacute;n es almacenada en tablas a modo de relaciones,  tal que permita la recuperaci&oacute;n desde diferentes perspectivas como actividad,  estructura, funci&oacute;n, familia (<a href="/img/revistas/rcci/v11n3/f0202317.jpg" target="_blank">Figura 2</a>). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la medida en que se introducen nuevas subsecuencias pept&iacute;dicas asociadas  a una actividad espec&iacute;fica, se crean las relaciones entre estas y las prote&iacute;nas  que las contengan. Esto se pone de manifiesto con mucha frecuencia debido a que  una subsecuencia pept&iacute;dica puede estar en varias prote&iacute;nas o varias veces en  una misma prote&iacute;na, donde pueden encontrarse separadas o solapadas. A partir de  la relevancia y cobertura se realiza la organizaci&oacute;n de la devoluci&oacute;n que da la  base de datos ante determinada b&uacute;squeda a partir de una subsecuencia pept&iacute;dica.  El trabajo offline se puede realizar debido a que la base de datos interna de  la aplicaci&oacute;n est&aacute; indexada con PDB. La importaci&oacute;n a la base de datos est&aacute;  flexibilizada por la variabilidad de los ficheros pdb.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Dise&ntilde;o de la interfaz del sistema</strong></font><font size="2"><strong></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La interfaz de  la aplicaci&oacute;n est&aacute; dividida en 5 &aacute;reas fundamentales (<a href="/img/revistas/rcci/v11n3/f0302317.jpg" target="_blank">Figura 3</a>):</font></p> <ol start="1" type="1">       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la barra de herramientas est&aacute;n contenidas las funciones b&aacute;sicas de       la aplicaci&oacute;n y el acceso al resto de las paletas. </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la paleta de gesti&oacute;n de base de datos se encuentran las bases de       datos que han sido cargadas o creadas recientemente.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El &aacute;rea de visualizaci&oacute;n de las prote&iacute;nas es donde se muestran las       prote&iacute;nas que han sido seleccionadas a partir de una b&uacute;squeda previa.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La paleta de b&uacute;squedas se  compone de dos subpaletas que contienen dos tipos de b&uacute;squeda diferentes  (b&uacute;squeda de prote&iacute;nas y b&uacute;squeda de subsecuencias) a las que se puede acceder  mediante la barra de herramientas. </font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La barra de estado muestra a la       izquierda la cantidad de prote&iacute;nas que han sido seleccionadas producto de       una b&uacute;squeda y a la derecha si se est&aacute;n cargando nuevas prote&iacute;nas para la       base de datos y el porciento en que se encuentra este proceso.</font></p>   </li>     </ol>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para analizar el funcionamiento de la herramienta propuesta, se dise&ntilde;&oacute;  un caso de estudio. Donde, se desea crear un modelo que sea capaz de predecir  actividad antimicrobiana de p&eacute;ptidos. Una primera aproximaci&oacute;n podr&iacute;a ser  realizar una b&uacute;squeda entre los segmentos de prote&iacute;nas conocidas (PDB). Debido  a que los p&eacute;ptidos de varios tipos naturales como piel de anfibios, de ara&ntilde;as y  p&eacute;ptidos propios del ser humano son antimicrobianos que exhiben patrones de  secuencias, una idea de partida pudiera ser buscar en prote&iacute;nas esos patrones y  sacar estos fragmentos para posterior-mente realizar experimentaci&oacute;n con ellas.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0402317.jpg" alt="f04" width="390" height="233"><a name="f04"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#f04">figura 4 </a>se muestran los pasos que se siguen en este proceso.  Primero, se realiza la b&uacute;squeda de prote&iacute;nas en el PDB. Segundo, se selecciona  el conjunto de prote&iacute;nas objetivo, pueden ser todas o solo un subconjunto de la  b&uacute;squeda. Tercero, se establece el criterio de b&uacute;squeda de forma sem&aacute;ntica.  Cuarto, b&uacute;squeda de p&eacute;ptidos seg&uacute;n estructura 2D. Quinto, se refina la b&uacute;squeda  atendiendo a las caracter&iacute;sticas f&iacute;sico qu&iacute;micas de los amino&aacute;cidos. Por  &uacute;ltimo, se exportar las prote&iacute;nas que cumplen con los criterios anteriores.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la realizaci&oacute;n de la b&uacute;squeda inicial de prote&iacute;nas en el PDB, se establecieron  los siguientes par&aacute;metros (<a href="/img/revistas/rcci/v11n3/f0502317.jpg" target="_blank">Figura 5.2</a>): secuencias con longitud de m&aacute;s de 50  amino&aacute;cidos, resoluci&oacute;n mayor que 65, obtenidas por difracci&oacute;n de rayos X y  organismos de procedencia de anfibios.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como resultado del paso uno y  dos del proceso, se obtiene un grupo de prote&iacute;nas que se supone puedan estar  relacionadas con la actividad buscada (<a href="/img/revistas/rcci/v11n3/f0502317.jpg" target="_blank">Figura 5.1</a>). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Bas&aacute;ndonos en la afirmaci&oacute;n de que la estructura secundaria de los  p&eacute;ptidos antimicrobianos de tipo uno presenta alfa h&eacute;lices (Jenssen, Hamill y Hancock 2006), el tercer paso es realizar  una criba de p&eacute;ptidos que contengan este motivo 30 veces.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para realizar esta b&uacute;squeda la expresi&oacute;n sem&aacute;ntica ser&iacute;a &ldquo;HHHHHHH&hellip;HH&rdquo; hasta  llegar a 30. Sin embargo, la construcci&oacute;n de la expresi&oacute;n de b&uacute;squeda est&aacute; dada  por el motivo, seguido del n&uacute;mero de veces en que debe estar repetido. Esto  provoca que ejecute el motor de sugerencias de expresiones con H30, lo cual  genera la expresi&oacute;n regular H{30}. La <a href="/img/revistas/rcci/v11n3/f0602317.jpg" target="_blank">figura 6.1</a> muestra los segmentos de alfa  h&eacute;lice que coincidieron con la expresi&oacute;n regular y las secuencias de  amino&aacute;cidos asociadas a los mismos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la mayor&iacute;a de los casos la b&uacute;squeda realizada en los pasos tres y cuatro  genera una gran cantidad de subsecuencias pept&iacute;dicas, por los que podr&iacute;a  hacerse necesario refinar esta b&uacute;squeda. En el quinto paso se acota la b&uacute;squeda  mediante el empleo de filtros. Como especificar si se permite que las  subsecuencias puedan solaparse (en este caso se permiti&oacute; hasta 5 amino&aacute;cidos de  solapamiento). As&iacute; como especificar los amino&aacute;cidos que puedan estar presentes  y los que no (en este caso deb&iacute;an estar presentes Prolina y Glicina, y no la  Ciste&iacute;na). Adicionalmente los amino&aacute;cidos pueden elegirse seg&uacute;n los criterios  de hidrofobicidad, polaridad y carga (<a href="/img/revistas/rcci/v11n3/f0602317.jpg" target="_blank">Figura 6.2</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los p&eacute;ptidos que cumplen con las restricciones anteriores no siempre se parecen  entre s&iacute;, por lo que se hace necesario encontrar las secuencias m&aacute;s similares.  Estas secuencias son asociadas con la actividad antimicrobiana analizada y se  almacenan en la base de datos con referencia a sus respectivas prote&iacute;nas  ( <a href="/img/revistas/rcci/v11n3/f0602317.jpg" target="_blank">figura 6.1</a>). Estas subsecuencias servir&aacute;n como plantilla para b&uacute;squedas  posteriores. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como &uacute;ltimo paso, las prote&iacute;nas que contienen a los p&eacute;ptidos seleccionados  pueden ser exportadas hacia una carpeta tal que se puedan realizar  experimentaciones espec&iacute;ficas con estas.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como resultado se obtuvo una nueva herramienta que facilita la selecci&oacute;n y  criba de prote&iacute;nas, entre otras funciones de gran inter&eacute;s. Extendiendo las  funcionalidades de <em>PDBSelect</em>, al  permitir la b&uacute;squeda en cadenas pept&iacute;dicas dentro del set de prote&iacute;nas, as&iacute;  como de homolog&iacute;as entre prote&iacute;nas y p&eacute;ptidos. La cual permite el trabajo de  forma conectada o desconectada al PDB.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JIRP es una herramienta  portable, desarrollada en Java, que consume pocos recursos y brinda una  interfaz simplificada e intuitiva para los investigadores. El empleo de un caso  de estudio que permiti&oacute; demostrar seis pasos sencillos la forma de obtener un  conjunto de prote&iacute;nas y subsecuencias pept&iacute;dicas que permitan a los  investigadores realizar posteriores investigaciones con estas. </font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>A</B><strong>GRADECIMIENTOS </strong></font>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al Laboratorio de Bioinform&aacute;tica del Centro de  Bioplantas, en Ciego de &Aacute;vila, Cuba</font>.</p>     <p align="left">      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ARNOLD, K., BORDOLI, L. y  SCHWEDE, T., 2006. Structural bioinformatics The  SWISS-MODEL workspace&#8239;: a web-based environment for protein structure homology  modelling. <em>Bioinformatics</em>, vol. 22, no. 2, pp. 195-201. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BI, C., BLUHM, W.F., CHRISTIE, C.H.,  ROSE, P.W., PRLI, A., DUTTA, S., GREEN, R.K., GOODSELL, D.S., WESTBROOK, J.D.,  WOO, J., YOUNG, J., ZARDECKI, C., BERMAN, H.M., BOURNE, P.E., RCSB, T., DATA,  P. y RCSB, B., 2015. The RCSB Protein Data Bank&#8239;: views of structural biology  for basic and applied research and education. <em>Nucleic Acids Research</em>,  vol. 43, no. November 2014, pp. 345-356. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHANDONIA, J., 2007. Structural  bioinformatics StrBioLib&#8239;: a Java library for development of custom  computational structural biology applications. <em>Bioinformatics</em>, vol. 23,  no. 15, pp. 2018-2020. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">COLAERT, N., MADDELEIN, D., IMPENS,  F., DAMME, P. Van, GEVAERT, K. y MARTENS, L., 2013. The Online Protein  Processing Resource ( TOPPR ): a database and analysis platform for protein  processing events. <em>Nucleic Acids Research</em>, vol. 41, no. October 2012,  pp. 333-337. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CONSORTIUM, T.U., 2017. UniProt&#8239;: the  universal protein knowledgebase. <em>Nucleic Acids Research</em>, vol. 45, no.  November 2016, pp. 158-169. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HIRSH, L., PIOVESAN, D., GIOLLO, M., FERRARI, C. y TOSATTO,  S.C.E., 2015. Structural bioinformatics The Victor  C11 library for protein representation and advanced manipulation. <em>Bioinformatics</em>,  vol. 31, no. November 2014, pp. 1138-1140. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HULO, N.; AMOS, BAIROCH; BULLIARD, VIRGINIE&#8239;; CERUTTI,  LORENZO; DE CASTRO, EDOUARD; LANGENDIJK-GENEVAUX, PETRA S.; PAGNI, MARCO;  SIGRIST, C.J.A., 2006. The PROSITE  database. <em>Nucleic Acids Research</em> [en l&iacute;nea], vol. 34, no. 90001, pp.  D227-D230. ISSN  0305-1048. DOI 10.1093/nar/gkj063. Disponible en:  https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkj063. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JENSSEN, H., HAMILL, P. y HANCOCK,  R.E.W., 2006. Peptide antimicrobial agents. <em>Clinical Microbiology Reviews</em>,  vol. 19, no. 3, pp. 491-511. ISSN 08938512. DOI 10.1128/CMR.00056-05. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KIEFER, F., ARNOLD, K., K&Uuml;NZLI, M.,  BORDOLI, L. y SCHWEDE, T., 2009. The SWISS-MODEL Repository and associated  resources. <em>Nucleic Acids Research</em>, vol. 37, no. SUPPL. 1, pp. 387-392.  ISSN 03051048. DOI 10.1093/nar/gkn750. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MARCHLER-BAUER, A., ZHENG, C.,  CHITSAZ, F., DERBYSHIRE, M.K., GEER, L.Y., GEER, R.C., GONZALES, N.R., GWADZ,  M., HURWITZ, D.I., LANCZYCKI, C.J., LU, F., LU, S.,</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MARCHLER, G.H., SONG, J.S.,  THANKI, N., YAMASHITA, R.A., ZHANG, D. y BRYANT, S.H., 2013. CDD&#8239;: conserved  domains and protein three-dimensional structure. <em>Nucleic Acids Research</em>,  vol. 41, no. November 2012, pp. 348-352. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MITCHELL, A., CHANG, H.Y., DAUGHERTY,  L., FRASER, M., HUNTER, S., LOPEZ, R., MCANULLA, C., MCMENAMIN, C., NUKA, G.,  PESSEAT, S., SANGRADOR-VEGAS, A., SCHEREMETJEW, M., RATO, C., YONG, S.Y.,  BATEMAN, A., PUNTA, M., ATTWOOD, T.K., SIGRIST, C.J.A., REDASCHI, N., RIVOIRE,  C., XENARIOS, I., KAHN, D., GUYOT, D., BORK, P.,</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LETUNIC, I., GOUGH, J., OATES,  M., HAFT, D., HUANG, H., NATALE, D.A., WU, C.H., ORENGO, C., SILLITOE, I., MI,  H., THOMAS, P.D. y FINN, R.D., 2015. The InterPro protein families database:  The classification resource after 15 years. <em>Nucleic Acids Research</em>, vol.  43, no. D1, pp. D213-D221. ISSN 13624962. DOI 10.1093/nar/gku1243. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SORMANNI, P., CAMILLONI, C., FARISELLI, P. y VENDRUSCOLO, M.,  2014. Simultaneous Sequence-Based Prediction of  the Statistical Populations of Ordered and Disordered Regions in Proteins. <em>Journal  of Molecular Biology</em>, vol. 43, pp. 345-356.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">STERN, P., H&Aring;KANSSON, A., T&Auml;HTINEN,  M. y ANGELIS, J., 2014. Evaluation of the NeoBio and SymBio programmes. <em>Tekes</em>,     </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WOLSTENCROFT, K., HAINES, R.,  FELLOWS, D., WILLIAMS, A., WITHERS, D., OWEN, S., SOILAND-REYES, S., DUNLOP,  I., NENADIC, A., FISHER, P., BHAGAT, J., BELHAJJAME, K., BACALL, F., HARDISTY,  A., NIEVA, A., HIDALGA, D., VARGAS, M.P.B., SUFI, S. y GOBLE, C., 2013. The  Taverna workflow suite&#8239;: designing and executing workflows of Web Services on  the desktop , web or in the cloud. <em>Nucleic Acids Research</em>, vol. 41, no.  May, pp. 557-561.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WU, D., CUI, F., JERNIGAN, R. y WU, Z., 2007. PIDD&#8239;:  database for Protein Inter-atomic Distance Distributions. <em>Nucleic Acids  Research</em>, vol. 35, no. December 2006, pp. 202-207.</font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ARNOLD]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[BORDOLI]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[SCHWEDE]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Structural bioinformatics The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 22</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>195-201</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BI]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[BLUHM]]></surname>
<given-names><![CDATA[W.F]]></given-names>
</name>
<name>
<surname><![CDATA[CHRISTIE]]></surname>
<given-names><![CDATA[C.H]]></given-names>
</name>
<name>
<surname><![CDATA[ROSE]]></surname>
<given-names><![CDATA[P.W]]></given-names>
</name>
<name>
<surname><![CDATA[PRLI]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[DUTTA]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[WESTBROOK]]></surname>
<given-names><![CDATA[J.D]]></given-names>
</name>
<name>
<surname><![CDATA[WOO]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[DATA]]></surname>
<given-names><![CDATA[H.M]]></given-names>
</name>
<name>
<surname><![CDATA[RCSB]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The RCSB Protein Data Bank: views of structural biology for basic and applied research and education]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 43</volume>
<numero>no. November 2014</numero>
<issue>no. November 2014</issue>
<page-range>345-356</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHANDONIA]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Structural bioinformatics StrBioLib: a Java library for development of custom computational structural biology applications]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 23</volume>
<numero>no. 15</numero>
<issue>no. 15</issue>
<page-range>2018-2020</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COLAERT]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[MADDELEIN]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[IMPENS]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[DAMME]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[GEVAERT]]></surname>
<given-names><![CDATA[Van]]></given-names>
</name>
<name>
<surname><![CDATA[MARTENS]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Online Protein Processing Resource ( TOPPR ): a database and analysis platform for protein processing events.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 41</volume>
<numero>no. October</numero>
<issue>no. October</issue>
<page-range>333-337</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CONSORTIUM]]></surname>
<given-names><![CDATA[T.U]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[UniProt: the universal protein knowledgebase]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 45</volume>
<numero>no. November 2016</numero>
<issue>no. November 2016</issue>
<page-range>158-169</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HIRSH]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[PIOVESAN]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[GIOLLO]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[FERRARI]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[TOSATTO]]></surname>
<given-names><![CDATA[S.C.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Structural bioinformatics The Victor C11 library for protein representation and advanced manipulation.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 31</volume>
<numero>no. November 2014</numero>
<issue>no. November 2014</issue>
<page-range>1138-1140</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HULO]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[BAIROCH]]></surname>
<given-names><![CDATA[AMOS]]></given-names>
</name>
<name>
<surname><![CDATA[CERUTTI]]></surname>
<given-names><![CDATA[LORENZO]]></given-names>
</name>
<name>
<surname><![CDATA[DE CASTRO]]></surname>
<given-names><![CDATA[EDOUARD]]></given-names>
</name>
<name>
<surname><![CDATA[PAGNI]]></surname>
<given-names><![CDATA[MARCO]]></given-names>
</name>
<name>
<surname><![CDATA[SIGRIST]]></surname>
<given-names><![CDATA[C.J.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The PROSITE database]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 34</volume>
<numero>no. 90001</numero>
<issue>no. 90001</issue>
<page-range>D227-D230</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[JENSSEN]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[HAMILL]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[HANCOCK]]></surname>
<given-names><![CDATA[R.E.W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Peptide antimicrobial agents]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 19</volume>
<numero>no. 3</numero>
<issue>no. 3</issue>
<page-range>pp. 491-511</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KIEFER]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[ARNOLD]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[KÜNZLI]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[BORDOLI]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[SCHWEDE]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The SWISS-MODEL Repository and associated resources]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 37,</volume>
<numero>no. SUPPL. 1</numero>
<issue>no. SUPPL. 1</issue>
<page-range>387-392</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MARCHLER]]></surname>
<given-names><![CDATA[G.H]]></given-names>
</name>
<name>
<surname><![CDATA[SONG]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
<name>
<surname><![CDATA[THANKI]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[YAMASHITA]]></surname>
<given-names><![CDATA[R.A]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[S.H]]></surname>
<given-names><![CDATA[BRYANT]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[CDD: conserved domains and protein three-dimensional structure]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 41</volume>
<numero>no. November 2012</numero>
<issue>no. November 2012</issue>
<page-range>348-352</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LETUNIC]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[OATES]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HAFT]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[HUANG]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[C.H]]></given-names>
</name>
<name>
<surname><![CDATA[ORENGO]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[SILLITOE]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[MI]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[THOMAS]]></surname>
<given-names><![CDATA[P.D]]></given-names>
</name>
<name>
<surname><![CDATA[FINN]]></surname>
<given-names><![CDATA[R.D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The InterPro protein families database: The classification resource after 15 years]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 43</volume>
<numero>no. D1</numero>
<issue>no. D1</issue>
<page-range>D213-D221</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SORMANNI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[CAMILLONI]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[FARISELLI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[VENDRUSCOLO]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Simultaneous Sequence-Based Prediction of the Statistical Populations of Ordered and Disordered Regions in Proteins]]></source>
<year>2014</year>
<volume>vol. 43</volume>
<page-range>. 345-356</page-range><publisher-name><![CDATA[Journal of Molecular Biology]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STERN]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[HÅKANSSON]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[TÄHTINEN]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[ANGELIS]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluation of the NeoBio and SymBio programmes]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WOLSTENCROFT]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[HAINES]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[FELLOWS]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[WILLIAMS]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[WITHERS]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[OWEN]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[SOILAND-REYES]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[DUNLOP]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[NENADIC]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[FISHER]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[BHAGAT]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[BELHAJJAME]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[BACALL]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[HARDISTY]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[NIEVA]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[HIDALGA]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[VARGAS]]></surname>
<given-names><![CDATA[M.P.B]]></given-names>
</name>
<name>
<surname><![CDATA[SUFI]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[GOBLE]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Taverna workflow suite: designing and executing workflows of Web Services on the desktop , web or in the cloud]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 41,</volume>
<numero>no. May</numero>
<issue>no. May</issue>
<page-range>557-561</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[CUI]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[JERNIGAN]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[PIDD: database for Protein Inter-atomic Distance Distributions]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 35</volume>
<numero>no. December 2006</numero>
<issue>no. December 2006</issue>
<page-range>202-207</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
