<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0253-570X</journal-id>
<journal-title><![CDATA[Revista de Salud Animal]]></journal-title>
<abbrev-journal-title><![CDATA[Rev Salud Anim.]]></abbrev-journal-title>
<issn>0253-570X</issn>
<publisher>
<publisher-name><![CDATA[Centro Nacional de Sanidad Agropecuaria]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0253-570X2015000200008</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Secuenciación y ensamblaje de novo de genomas bacterianos: una alternativa para el estudio de nuevos patógenos]]></article-title>
<article-title xml:lang="en"><![CDATA[Sequencing and de novo assembly of bacterial genomes: an approach to study new]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Aguilar-Bultet]]></surname>
<given-names><![CDATA[Lisandra]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Falquet]]></surname>
<given-names><![CDATA[Laurent]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Centro Nacional de Sanidad Agropecuaria (CENSA) Dirección de Salud Animal Departamento de Microbiología]]></institution>
<addr-line><![CDATA[Mayabeque Cuba]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Instituto Suizo de Bioinformática Universidad de Fribourg División de Bioquímica]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Suiza</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>08</month>
<year>2015</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>08</month>
<year>2015</year>
</pub-date>
<volume>37</volume>
<numero>2</numero>
<fpage>125</fpage>
<lpage>132</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S0253-570X2015000200008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S0253-570X2015000200008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S0253-570X2015000200008&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Las tecnologías de secuenciación de nueva generación han revolucionado el campo de la genómica, permitiendo la secuenciación de un gran número de genomas en muy poco tiempo. El genoma brinda, en principio, el catálogo completo de genes que un organismo puede expresar, pero la interpretación de esta información, a todos los niveles (desde el enorme volumen de datos crudos originados por el secuenciador hasta los miles de genes identificados en paralelo asociados a diversas funciones) constituye un gran reto desde el punto de vista computacional. El ensamblaje de novo es uno de los procedimientos empleados para reconstruir genomas, principalmente bacterianos. En este artículo se revisan las principales tendencias en la secuenciación y, específicamente, en el ensamblaje de novo.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Next Generation Sequencing technologies have revolutionized the field of genomics allowing sequencing of a large number of genomes in a short period of time. The genome provides, in principle, the complete catalogue of genes which can be expressed by a microorganism. But the interpretation of this information, at each level (from the huge volume of raw data originated by the sequencer to the thousands of genes identified in parallel associated with various functions), is a major challenge from the computational point of view. De novo assembly is one of the approaches used to reconstruct genomes, particularly bacterial genomes. In this paper the main trends regarding sequencing, and specifically the de novo assembly, are reviewed.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[secuenciación de genomas]]></kwd>
<kwd lng="es"><![CDATA[tecnologías de secuenciación de nueva generación]]></kwd>
<kwd lng="es"><![CDATA[ensamblaje de novo]]></kwd>
<kwd lng="en"><![CDATA[genome sequencing]]></kwd>
<kwd lng="en"><![CDATA[next generation sequencing]]></kwd>
<kwd lng="en"><![CDATA[de novo assembly]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO    RESE&Ntilde;A</B> </font></p>     <p>&nbsp;</p> <h1> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b><font size="4">Secuenciaci&oacute;n    y ensamblaje <i>de novo</i> de genomas bacterianos: una alternativa para el    estudio de nuevos pat&oacute;genos </font></b></font></h1>     <p>&nbsp;</p> <h1> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b><font size="3">Sequencing    and <i>de novo</i> assembly of bacterial genomes: an approach to study new pathogens    </font> </b></font></h1>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Lisandra Aguilar-Bultet<SUP>I</SUP>,    Laurent Falquet<SUP>II</SUP></b></font><b> </b></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><SUP>I</SUP>Departamento    de Microbiolog&iacute;a, Direcci&oacute;n de Salud Animal, Centro Nacional de    Sanidad Agropecuaria (CENSA), Apartado 10, Mayabeque, Cuba. Correo electr&oacute;nico:    <U><a href="mailto:labultet@censa.edu.cu">labultet@censa.edu.cu</a></U>, <U><a href="mailto:labultet@gmail.com">labultet@gmail.com</a></U>.    <SUP>    <br>   II</SUP>Departamento de Biolog&iacute;a, Divisi&oacute;n de Bioqu&iacute;mica,    Universidad de Fribourg, Instituto Suizo de Bioinform&aacute;tica, Suiza. </font>     <P>&nbsp;     <P>&nbsp; <hr noshade size="1">     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>RESUMEN</B></font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las tecnolog&iacute;as    de secuenciaci&oacute;n de nueva generaci&oacute;n han revolucionado el campo    de la gen&oacute;mica, permitiendo la secuenciaci&oacute;n de un gran n&uacute;mero    de genomas en muy poco tiempo. El genoma brinda, en principio, el cat&aacute;logo    completo de genes que un organismo puede expresar, pero la interpretaci&oacute;n    de esta informaci&oacute;n, a todos los niveles (desde el enorme volumen de    datos crudos originados por el secuenciador hasta los miles de genes identificados    en paralelo asociados a diversas funciones) constituye un gran reto desde el    punto de vista computacional. El ensamblaje <I>de novo</I> es uno de los procedimientos    empleados para reconstruir genomas, principalmente bacterianos. En este art&iacute;culo    se revisan las principales tendencias en la secuenciaci&oacute;n y, espec&iacute;ficamente,    en el ensamblaje <I>de novo</I>. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Palabras clave</B>:    secuenciaci&oacute;n de genomas, tecnolog&iacute;as de secuenciaci&oacute;n    de nueva generaci&oacute;n, ensamblaje <I>de novo</I>.</font> <hr noshade size="1">     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ABSTRACT</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Next Generation    Sequencing technologies have revolutionized the field of genomics allowing sequencing    of a large number of genomes in a short period of time. The genome provides,    in principle, the complete catalogue of genes which can be expressed by a microorganism.    But the interpretation of this information, at each level (from the huge volume    of raw data originated by the sequencer to the thousands of genes identified    in parallel associated with various functions), is a major challenge from the    computational point of view. <I>De novo</I> assembly is one of the approaches    used to reconstruct genomes, particularly bacterial genomes. In this paper the    main trends regarding sequencing, and specifically the <I>de novo</I> assembly,    are reviewed. </font> </p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Key words: </B>genome    sequencing, next generation sequencing, <I>de novo </I>assembly. </font> <hr noshade size="1">     <P>&nbsp;     <P>&nbsp;     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B><font size="3">INTRODUCCI&Oacute;N</font></B>    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La caracterizaci&oacute;n    completa de un microorganismo en el laboratorio constituye un proceso muy costoso    y laborioso que consume mucho tiempo. Con el incremento de las capacidades de    secuenciaci&oacute;n a partir del surgimiento de las tecnolog&iacute;as de secuenciaci&oacute;n    de nueva generaci&oacute;n en el a&ntilde;o 2005, se ha abierto un nuevo camino    en este campo. Entre los principales aportes de estas nuevas tecnolog&iacute;as    cabe citar que han facilitado la secuenciaci&oacute;n del ADN gen&oacute;mico    de un alto n&uacute;mero de bacterias, gener&aacute;ndose un gran volumen de    datos en corto tiempo. La obtenci&oacute;n de un genoma completo permite contar,    en principio, con el cat&aacute;logo completo de genes que un organismo puede    expresar en cualquier momento de su ciclo de vida. De ah&iacute; la importancia    de las tecnolog&iacute;as de nueva generaci&oacute;n (NGS, por sus siglas en    ingl&eacute;s, <I>Next Generation Sequencing</I>), que al permitir el procesamiento    masivo y en paralelo de las muestras, reducen notablemente los costos y el tiempo    para obtener la secuencia gen&oacute;mica, en comparaci&oacute;n con la secuenciaci&oacute;n    autom&aacute;tica de Sanger (1). </font>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para procesar y    analizar el enorme volumen de datos biol&oacute;gicos acumulados, como resultado    del uso de estas tecnolog&iacute;as, ha sido necesario el empleo de herramientas    bioinform&aacute;ticas que permitan manipular eficientemente esta creciente    cantidad de informaci&oacute;n, herramientas que tambi&eacute;n se han venido    modificando y perfeccionando junto al propio desarrollo de las tecnolog&iacute;as    NGS. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La presente revisi&oacute;n    tiene como objetivo describir las tendencias actuales para la secuenciaci&oacute;n    y el ensamblaje <I>de novo</I> de genomas. </font>     <P>&nbsp; <H1> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B><font size="3">DESARROLLO</font></B>    </font></H1>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Secuenciaci&oacute;n    de genomas</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La secuenciaci&oacute;n    de genomas completos es un m&eacute;todo poderoso para la r&aacute;pida identificaci&oacute;n    de genes en un organismo, y sirve como herramienta b&aacute;sica para posteriores    an&aacute;lisis funcionales de los nuevos genes descubiertos. La secuencia gen&oacute;mica    provee de un conjunto de virtualmente todas las prote&iacute;nas que el organismo    puede expresar. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El m&eacute;todo    de secuenciaci&oacute;n autom&aacute;tica de Sanger domin&oacute; la industria    de secuenciaci&oacute;n por casi 20 a&ntilde;os, llevando a innumerables logros    en este campo, como fue la secuenciaci&oacute;n del primer genoma bacteriano    <I>Haemophilus influenzae</I> y la primera secuencia completa del genoma humano.    A pesar de las mejoras t&eacute;cnicas durante los &uacute;ltimos a&ntilde;os,    las limitaciones de la tecnolog&iacute;a de Sanger trajo consigo la necesidad    de desarrollar nuevas y mejores alternativas para la secuenciaci&oacute;n de    un gran n&uacute;mero de genomas en corto tiempo (1). Es por ello que surgen    las tecnolog&iacute;as de secuenciaci&oacute;n de nueva generaci&oacute;n. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La tecnolog&iacute;a    454, conocida como pirosecuenciaci&oacute;n, fue la primera NGS en salir al    mercado entre los a&ntilde;os 2004 y 2005 (2). A continuaci&oacute;n surgieron    <I>Illumina</I> en 2006 (3), basada en secuenciaci&oacute;n por s&iacute;ntesis,    <I>SOLiD</I> en 2007, basada en secuenciaci&oacute;n por ligaci&oacute;n, y    <I>Ion Torrent</I> en el a&ntilde;o 2010 (4), basada en detecci&oacute;n de    pH, las cuales necesitan de la amplificaci&oacute;n del ADN previamente a su    secuenciaci&oacute;n. Adem&aacute;s, se han desarrollado tecnolog&iacute;as    que no necesitan del paso inicial de amplificaci&oacute;n, sino que secuencian    directamente una sola mol&eacute;cula de ADN, entre las que se encuentran <I>Helicos</I>,    salida al mercado en 2008 (5) y <I>SMRT Pacific Biosciences </I>(<I>PacBio</I>)    en 2010 (6). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Caracter&iacute;sticas    generales de las tecnolog&iacute;as NGS</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La mayor ventaja    ofrecida por las NGS es la capacidad para producir un inmenso volumen de datos    de forma econ&oacute;mica, pudiendo llegar a millones o billones de <I>reads<SUP>1    </SUP></I>en solamente una corrida del equipo para un &uacute;nico genoma, en    comparaci&oacute;n con la secuenciaci&oacute;n autom&aacute;tica de Sanger,    que puede llegar solo hasta cientos de <I>reads </I>(7), pero con una longitud    de hasta 1000 pb aproximadamente. Por tanto, con las tecnolog&iacute;as NGS    se incrementa considerablemente la cobertura del genoma, que no es m&aacute;s    que la cantidad promedio de veces que un nucle&oacute;tido es representado en    un conjunto de secuencias crudas al azar (8). Sin embargo, los datos de NGS    generalmente son secuencias m&aacute;s cortas (a excepci&oacute;n de los producidos    por <I>PacBio</I>), que representan un reto desde el punto de vista computacional    para su ensamblaje, debido a la longitud y la enorme cantidad de secuencias.    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Aplicaciones    de las tecnolog&iacute;as NGS en el estudio de pat&oacute;genos</B> </font>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Antes de enfrentarse    a un proyecto de secuenciaci&oacute;n, los investigadores deben realizarse varias    interrogantes: &#191;Cu&aacute;l es el microorganismo en cuesti&oacute;n? &#191;Existe    un genoma que se pueda utilizar como referencia?&#191;Qu&eacute; caracter&iacute;sticas    tiene el genoma? A partir de todo lo anterior se decide la tecnolog&iacute;a    m&aacute;s adecuada para la secuenciaci&oacute;n y, por consiguiente, el m&eacute;todo    a emplear para el an&aacute;lisis de los datos, incluido el ensamblaje del genoma.    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las aplicaciones    de las tecnolog&iacute;as NGS se extienden a muchos campos de la biolog&iacute;a,    como la gen&oacute;mica, la transcript&oacute;mica, la epigen&eacute;tica, la    gen&oacute;mica de poblaciones, la metagen&oacute;mica, entre otros. Inicialmente,    la aplicaci&oacute;n m&aacute;s obvia fue la secuenciaci&oacute;n de genomas    completos, incluyendo resecuenciaci&oacute;n o secuenciaci&oacute;n <I>de novo</I>.    Proyectos de resecuenciaci&oacute;n requieren un genoma de referencia en el    que se alinean los <I>reads</I> para detectar variaciones. Por el contrario,    los proyectos <I>de novo</I> no tienen genoma de referencia disponible, y los    <I>reads</I> se utilizar&aacute;n &uacute;nicamente para la reconstrucci&oacute;n    de todo el genoma. En la actualidad, las NGS se emplean, adem&aacute;s, para    la secuenciaci&oacute;n de ARN con el objetivo de cuantificar la expresi&oacute;n    g&eacute;nica. Paralelamente, han surgido t&eacute;cnicas m&aacute;s espec&iacute;ficas    como la secuenciaci&oacute;n acoplada a inmunoprecipitaci&oacute;n de la cromatina    (<I>ChIP-seq</I>) para el estudio de las interacciones ADN-prote&iacute;nas,    la secuenciaci&oacute;n de ADN con bisulfito (<I>Methyl-seq</I>) para el an&aacute;lisis    de la metilaci&oacute;n del ADN, la secuenciaci&oacute;n de ADN asociada a sitios    de restricci&oacute;n (<I>RAD-seq</I>), entre otras. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las NGS se han    empleado en el estudio de microorganismos pat&oacute;genos. Un ejemplo palpable    lo constituyen los estudios realizados en <I>Avibacterium paragallinarum</I>,    agente causal de la coriza infecciosa en pollos, que afecta considerablemente    a la industria av&iacute;cola, provocando grandes p&eacute;rdidas por concepto    de retardo en el crecimiento y disminuci&oacute;n en la producci&oacute;n de    huevos. La obtenci&oacute;n de varios borradores de diferentes cepas virulentas    de este genoma ha permitido la identificaci&oacute;n de los factores de virulencia    m&aacute;s importantes de este microorganismo (9, 10, 11, 12), con especial    &eacute;nfasis en la toxinas RTX (por sus siglas en ingl&eacute;s, <I>Repeats    in ToXins</I>) y CDT (por sus siglas en ingl&eacute;s, <I>Cytolethal Distending    Toxins</I>) (11); trabajos que han sido validados experimentalmente en el laboratorio    (13, 14), y que han demostrado que las t&eacute;cnicas bioinform&aacute;ticas    brindan una adecuada aproximaci&oacute;n a la realidad biol&oacute;gica. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La secuenciaci&oacute;n    de genomas tambi&eacute;n ha sido aplicada recientemente al estudio de los mecanismos    de resistencia a antibi&oacute;ticos, espec&iacute;ficamente a la linezolida,    de especies de <I>Staphylococcus</I> como <I>S. epidermidis</I>, el cual se    caracteriza por ser un contaminante frecuente de muestras de laboratorio y estar    presente en la piel y mucosas de humanos y diversos animales (bovinos, caninos,    equinos), pero tambi&eacute;n se ha descrito que puede causar mastitis, ocasionalmente,    en ganado bovino. Como resultado de la secuenciaci&oacute;n por NGS de 28 aislados,    se identificaron mutaciones en el ARNr 23S y en las riboprote&iacute;nas L3    y L4, que est&aacute;n relacionadas con la resistencia a la linezolida (15).    Tambi&eacute;n se ha estudiado la resistencia a antibi&oacute;ticos en <I>Salmonella    enterica </I>serovar Heidelberg, bacteria de trasmisi&oacute;n alimentaria que    puede afectar a humanos, cerdos, pavos, entre otros. Las NGS han permitido el    estudio de algunas cepas muy patog&eacute;nicas de este serovar que por m&eacute;todos    convencionales no se pueden diferenciar de otras menos patog&eacute;nicas (16).    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se ha aplicado    tambi&eacute;n esta metodolog&iacute;a para la identificaci&oacute;n y tipificaci&oacute;n    de cepas de <I>Streptococcus suis</I>, pat&oacute;geno de gran incidencia para    la industria porcina mundial, que provoca meningitis y en menor medida septicemia,    artritis, neumon&iacute;a, entre otros; constituye, adem&aacute;s, un peligro    para los humanos con riesgo para la vida. Se secuenciaron y compararon un total    de 85 aislados de <I>S. suis</I>, lo cual permiti&oacute; no solo la identificaci&oacute;n    taxon&oacute;mica de los mismos, sino que se demostr&oacute; su potencial patog&eacute;nico    y epid&eacute;mico. A partir del an&aacute;lisis del genoma n&uacute;cleo en    todos los aislados, se lograron diferenciar claramente aquellos que provocan    s&iacute;ntomas severos, de aquellos que solo causan meningitis espor&aacute;dicas    de menor impacto (17). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para los micoplasmas    tambi&eacute;n se han empleado las NGS, como es el caso de <I>Mycoplasma mycoides    mycoides</I> &#171;Small Colony&#187; (MmmSC), el cual es el agente responsable    de la pleuroneumon&iacute;a contagiosa bovina, enfermedad de notificaci&oacute;n    obligatoria de la Organizaci&oacute;n Mundial de Sanidad Animal (OIE). Se emplearon    20 cepas representativas de lugares geogr&aacute;ficos diferentes. Como resultado    de la secuenciaci&oacute;n y ensamblaje de los genomas, se pudo obtener un robusto    &aacute;rbol filogen&eacute;tico que identific&oacute; un linaje espec&iacute;fico    a las cepas europeas, mientras las cepas africanas se ubican dispersas en varias    ramas. Se pudo determinar, adem&aacute;s, el ancestro com&uacute;n m&aacute;s    reciente y los posibles or&iacute;genes de las cepas africanas y de los brotes    recientes en Europa (18). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por otro lado,    la secuenciaci&oacute;n del genoma de la cepa Illinois de <I>Mycoplasma suis</I>,    agente causal de la anemia infecciosa porcina, permiti&oacute; la identificaci&oacute;n    de mecanismos metab&oacute;licos responsables probablemente de su adaptaci&oacute;n,    crecimiento y desarrollo en los eritrocitos (19). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Ensamblaje de    genomas</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Al proceso de descifrar    la secuencia gen&oacute;mica a partir de peque&ntilde;os fragmentos de ADN,    en conjunto con alguna informaci&oacute;n adicional disponible, se le denomina    ensamblaje de genomas. Las estrategias para el ensamblaje de genomas se pueden    dividir en dos categor&iacute;as: ensamblaje por comparaci&oacute;n, en el que    se utiliza un genoma como referencia; y ensamblaje <I>de novo</I>, en el cual    se utiliza solo la informaci&oacute;n obtenida de la secuenciaci&oacute;n para    reconstruir el genoma en cuesti&oacute;n, sin conocimiento <I>a priori</I> de    la organizaci&oacute;n del mismo (20). Sin embargo, en esta &uacute;ltima estrategia    algunas informaciones previas son &uacute;tiles, como la talla esperada del    genoma, el contenido de GC y el contenido de regiones repetitivas, ya que ayudan    a elegir la mejor estrategia a seguir. Estos datos pueden ser inferidos a partir    de secuencias de organismos relacionados. El ensamblaje <I>de novo</I> con datos    de NGS se limita generalmente a proyectos de genomas microbianos debido a su    peque&ntilde;a talla (21, 22). Esta metodolog&iacute;a es la m&aacute;s desafiante,    y a la que nos referiremos en lo adelante. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">De manera general,    los pasos para el ensamblaje <I>de novo</I> se resumen en la <a href="#f1">Figura</a>.</font>      ]]></body>
<body><![CDATA[<P align="center"><img src="/img/revistas/rsa/v37n2/f0108215.jpg" width="396" height="323">    <a name="f1"></a>      
<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Control de calidad    y correcci&oacute;n de los datos</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El control de calidad    de los datos crudos sirve como un chequeo r&aacute;pido para identificar y excluir    datos con problemas serios de calidad, lo cual permite ahorrar gran cantidad    de tiempo en los an&aacute;lisis posteriores (23). Las herramientas empleadas    chequean la calidad de las bases (probabilidad de que la base asignada sea la    correcta), la distribuci&oacute;n de los nucle&oacute;tidos, la distribuci&oacute;n    del contenido de GC, secuencias repetidas, entre otros par&aacute;metros. En    dependencia de la calidad inicial de los datos, ser&aacute;n los procesos de    correcci&oacute;n a seguir. En los casos de secuencias cortas, producidas por    tecnolog&iacute;as NGS de segunda generaci&oacute;n (<I>Illumina</I>, <I>IonTorrent</I>,    SOLiD), la tendencia es a filtrar los <I>reads</I> que tengan poca calidad,    o cortarlos a partir de la posici&oacute;n en la cual la calidad comienza a    decaer. Se estima que el porcentaje de error de los datos crudos se encuentra    entre 0.1-1%. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En plataformas    de tercera generaci&oacute;n, como <I>PacBio RS</I>, se construyen dos tipos    de bibliotecas: CLR (<I>Continuous Long Reads</I>, por sus siglas en ingl&eacute;s,    <I>reads</I> largos continuos) y CCS (<I>Circular Consensus Sequences</I>, por    sus siglas en ingl&eacute;s, secuencias consenso circulares). Durante la correcci&oacute;n    de los errores de la biblioteca CLR, se usan <I>reads</I> cortos de alta calidad,    como los CCS o los producidos por <I>Illumina</I> o <I>454</I>. Se estima que    el porcentaje de error de los datos CLR crudos es de aproximadamente del 15%    (24); por ello se recomienda corregirlos, ya sea con datos de segunda generaci&oacute;n    o con secuencias CCS. Pero la plataforma <I>PacBio RS</I> est&aacute; obsoleta    y casi en desuso. En la versi&oacute;n actual, <I>PacBio RS II</I>, solo se    construye la biblioteca CLR, pero con una mayor cobertura de <I>reads</I>, lo    que permite agruparlos de acuerdo a la longitud y posteriormente utilizar los    m&aacute;s cortos para la correcci&oacute;n de los m&aacute;s largos, y de esta    manera eliminar errores. Con el desarrollo del paquete de programas HGAP se    ha facilitado la manipulaci&oacute;n de este tipo de datos, desde su correcci&oacute;n    hasta el ensamblaje (25). De este modo, seg&uacute;n los fabricantes, se reducen    los errores por debajo del 0.1%. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Metodolog&iacute;as    empleadas en el ensamblaje <I>de novo</I></B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Todos los m&eacute;todos    de ensamblaje se basan en la simple suposici&oacute;n de que fragmentos de ADN    altamente similares se originan de la misma posici&oacute;n dentro del genoma.    De esta manera, la similitud entre secuencias de ADN se usa para conectar fragmentos    individuales en secuencias contiguas m&aacute;s largas, denominadas <I>contigs    </I>(secuencias consenso obtenidas a partir del ensamblaje de los <I>reads</I>)<I>.</I>    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las tecnolog&iacute;as    NGS han reformado la biolog&iacute;a en la actualidad, incluyendo el ensamblaje    de genomas. En comparaci&oacute;n con el m&eacute;todo tradicional de Sanger,    el rendimiento de los datos obtenidos por estas nuevas tecnolog&iacute;as es    significativamente mayor y los costos mucho menores (1). Sin embargo, representan    un nuevo reto desde el punto de vista computacional para el ensamblaje <I>de    novo</I>, debido a la corta longitud de los fragmentos secuenciados. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los <I>reads</I>    de corta longitud constituyen un problema cuando hay repeticiones en el genoma    (7). Las repeticiones o regiones repetitivas son segmentos de ADN que aparecen    m&aacute;s de una vez a lo largo del genoma. Cuando un <I>read</I> proviene    de una regi&oacute;n repetitiva, y es m&aacute;s corto que esta, no se sabe    con certeza de cu&aacute;l copia de la repetici&oacute;n se obtuvo. Es por ello    que durante el ensamblaje, se pueden crear falsas uniones en el genoma en las    regiones de repeticiones. Adem&aacute;s, debido a las regiones repetitivas,    muchas veces resulta dif&iacute;cil ensamblar todos los fragmentos para que    se logre, en un solo evento, reconstruir la secuencia del genoma completo, incluso    en genomas microbianos peque&ntilde;os. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para abordar estos    problemas debidos a los fragmentos cortos en las tecnolog&iacute;as NGS de segunda    generaci&oacute;n, se han desarrollado nuevos secuenciadores que incrementan    la longitud de los mismos mientras mantienen el rendimiento (cantidad de ADN    que puede ser procesado por unidad de tiempo) (26). Por ejemplo, el secuenciador    SMRT de <I>Pacific Bioscences</I> produce <I>reads</I> de varios kb de longitud    (2-10 kb) (6, 27), incluso en las &uacute;ltimas versiones pueden alcanzar los    20 kb (<U><a href="http://www.pacificbiosciences.com/products/smrt-technology/smrt-sequencing-advantage/">http://www.pacificbiosciences.com/products/smrt-technology/smrt-sequencing-advantage/</a></U>    ). Sin embargo, esta tecnolog&iacute;a todav&iacute;a no es estable en t&eacute;rminos    de calidad de los <I>reads </I>(1). No obstante, se han obtenido interesantes    y buenos resultados a partir del ensamblaje de datos de <I>PacBio</I>, previamente    corregidos con fragmentos de alta calidad y corta longitud, obteni&eacute;ndose    borradores de genomas con una calidad mejorada en relaci&oacute;n con los anteriormente    obtenidos, en el caso de <I>Avibacterium paragallinarum </I>(11). Tambi&eacute;n    se obtuvo el genoma de la cepa JF4335 de <I>Clostridium chauvoei </I>combinando    datos de <I>Illumina</I> y datos de <I>PacBio</I>, con excelentes resultados    (28). Actualmente la nueva plataforma <I>PacBio RS II,</I> y el subsiguiente    procesamiento de los <I>reads</I> con el paquete HGAP, han permitido la obtenci&oacute;n    de un solo <I>contig</I> como resultado del proceso de ensamblaje, lo cual supera    cualquier programa previamente empleado (25, 29). </font>      <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Computacionalmente    es posible alargar los <I>reads</I> de NGS usando la t&eacute;cnica de extremos    pareados (PE, por sus siglas en ingl&eacute;s, <I>paired-ends</I>). En este    caso, se conoce la secuencia de ambos extremos (que ser&iacute;an los <I>reads</I>)    de un fragmento de ADN y la distancia aproximada entre ellos. Cuando la longitud    del fragmento de ADN es menor que dos veces la longitud del <I>read</I>, los    dos extremos se solapan, lo cual permite unirlos para formar una secuencia m&aacute;s    larga. </font>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las estrategias    empleadas por los programas ensambladores de secuencias pueden agruparse en    tres paradigmas principales: Greedy, Overlap-Layout-Consensus y gr&aacute;ficos    de Bruijn (30). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><U>Greedy</U>:    Es el algoritmo m&aacute;s sencillo e intuitivo. El ensamblador siempre conecta    los <I>reads</I> que mejor se solapan, de manera iterativa, mientras no contradigan    el ensamblaje ya construido. Sin embargo, esta metodolog&iacute;a no es ampliamente    empleada, ya que es inherentemente un proceso de ensamblaje local, no emplea    informaci&oacute;n global, y no resuelve de manera eficiente largas regiones    repetitivas en los genomas. Greedy se usa generalmente para el ensamblaje de    datos originados por secuenciaci&oacute;n Sanger. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><U>OLC (por sus    siglas en ingl&eacute;s, Overlap-Layout-Consensus)</U>: Este m&eacute;todo primero    identifica todos los pares de <I>reads</I> que se solapan lo suficientemente    bien y organiza esta informaci&oacute;n en un gr&aacute;fico en el cual hay    un nodo por cada uno de ellos y un conector (<I>edge</I>) por cada solapamiento    entre los mismos. Esta estructura del gr&aacute;fico permite el desarrollo de    complejos algoritmos de ensamblaje que tienen en cuenta la relaci&oacute;n global    entre los <I>reads</I>. De esta manera se definen caminos, que corresponden    con los segmentos del genoma que est&aacute;n siendo ensamblados. Finalmente,    se reconstruye el genoma mediante la b&uacute;squeda de un &uacute;nico camino    que atraviese todos los nodos solo una vez. Este paradigma domin&oacute; el    mundo del ensamblaje hasta la emergencia de las tecnolog&iacute;as NGS. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><U>Gr&aacute;ficos    De Bruijn</U>: Los ensambladores basados en gr&aacute;ficos De Bruijn modelan    la relaci&oacute;n entre subcadenas exactas de longitud <I>k</I> dentro de los    <I>reads</I>. De manera similar al m&eacute;todo OLC, los nodos en el gr&aacute;fico    representan <I>k-mers</I>, y los conectores indican que <I>k-mers</I> adyacentes    se solapan por <I>k-</I>1 letras, por lo que la longitud del <I>k-mer</I> correlaciona    con la longitud del solapamiento que el ensamblador es capaz de detectar. En    esta metodolog&iacute;a no se modelan directamente los <I>reads</I>, sino que    est&aacute;n impl&iacute;citamente representados por los conectores en el gr&aacute;fico    de Bruijn. La mayor&iacute;a de los ensambladores usan la informaci&oacute;n    global de los <I>reads</I> para refinar la estructura del gr&aacute;fico, resolver    repeticiones y eliminar patrones no consistentes. Adem&aacute;s, incorporan    m&eacute;todos de correcci&oacute;n de errores para mejorar la calidad del ensamblaje.    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Muchos de los programas    ensambladores incluyen adem&aacute;s, el proceso de <I>scaffolding</I>, mediante    el cual intentan conectar los <I>contigs</I> obtenidos empleando la informaci&oacute;n    que brindan las bibliotecas PE, cuando varios <I>reads</I> en el extremo de    un <I>contig</I> &#171;apuntan&#187; todos hacia otro <I>contig</I>. A pesar    de no conocer la secuencia entre ellos, se pueden conectar, dejando una distancia    aproximada, determinada por la longitud del inserto. Por tanto, se puede inferir    cu&aacute;ndo dos <I>contigs</I> son adyacentes, si cada <I>read</I> PE se ubica    en cada <I>contig</I> a la distancia y orientaci&oacute;n esperadas. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Otra herramienta    muy &uacute;til en el proceso de <I>scaffolding</I> es la construcci&oacute;n    de bibliotecas <I>mate-pairs</I>, en la cual, de manera similar a la biblioteca    PE, se conocen las secuencias de dos segmentos separados por una distancia determinada    que tambi&eacute;n se conoce, pero en este caso la distancia puede ser de hasta    150 kb (31). Esta informaci&oacute;n puede ser utilizada para concatenar un    conjunto de <I>contigs </I>y formar <I>scaffolds</I>. Se puede inferir que dos    <I>contigs</I> son adyacentes en el genoma si un extremo de un <I>mate-pair</I>    est&aacute; unido al primer <I>contig </I>y el otro extremo est&aacute; fusionado    al segundo. Esta estrategia la utilizan programas como Euler (32), Bambus (33),    Celera (34), Velvet (35) y Arachne (36). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La compa&ntilde;&iacute;a    <I>Pacific Bioscences</I>, con el lanzamiento de su m&aacute;quina secuenciadora,    tambi&eacute;n lanz&oacute; un <I>pipeline</I> para el an&aacute;lisis y ensamblaje    de los datos, denominado <I>SMRT Pipe&#174;</I>. Este <I>pipeline</I> incluye    m&uacute;ltiples herramientas para la correcci&oacute;n de errores, ensamblaje    <I>de novo</I>, ensamblaje h&iacute;brido (cuando se combinan datos de m&aacute;s    de una tecnolog&iacute;a), detecci&oacute;n de variantes estructurales, detecci&oacute;n    de modificaciones postranscripcionales, entre otras. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Evaluaci&oacute;n    de la calidad del ensamblaje</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Aunque ut&oacute;pico,    el objetivo final del ensamblaje <I>de novo</I> es obtener un n&uacute;mero    de fragmentos igual al n&uacute;mero total de cromosomas, en el caso de las    bacterias un cromosoma, y tambi&eacute;n pueden haber pl&aacute;smidos que se    obtienen como fragmentos separados. Por lo tanto, el investigador siempre busca    obtener el menor n&uacute;mero de <I>contigs</I> posible. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Existen algunos    indicadores m&eacute;tricos que permiten evaluar la calidad del ensamblaje cuantitativamente.    Se calcula generalmente la talla m&iacute;nima, m&aacute;xima y media de los    <I>contigs</I>, as&iacute; como la talla total del ensamblaje, la cual debe    coincidir con la talla esperada del genoma. Pero el principal valor estad&iacute;stico    es el valor N50, el cual corresponde con el menor de los mayores <I>contigs</I>    que cubren la mitad del genoma. Aunque el valor N50 constituye un indicador    acerca de la contig&uuml;idad del genoma (i.e. cu&aacute;n acertado fue el programa    ensamblador en unir las secuencias contiguas en una &uacute;nica secuencia m&aacute;s    larga), no es una se&ntilde;al de precisi&oacute;n y calidad del genoma ensamblado.    Tampoco brinda una correcta estimaci&oacute;n de si la talla del ensamblaje    difiere o no de la talla esperada (30). </font>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para una mejor    valoraci&oacute;n de la calidad, desde el punto de vista cualitativo, se puede    realizar el alineamiento de los <I>reads</I> con los <I>contigs</I> obtenidos,    proceso denominado remapeo (30). La visualizaci&oacute;n de estos alineamientos    permite analizar la consistencia del genoma y si los <I>contigs</I> son confiables;    adem&aacute;s, la informaci&oacute;n PE y las variaciones inesperadas de cobertura    permiten identificar potenciales regiones mal ensambladas (37). Otra estrategia    es comparar la secuencia obtenida con otras secuencias gen&oacute;micas, ya    sea una secuencia de referencia, o genomas de organismos relacionados (38).    </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Proceso de terminaci&oacute;n    del genoma</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El proceso de terminaci&oacute;n    del genoma es el paso que m&aacute;s tiempo consume en la secuenciaci&oacute;n.    Muchas veces se asocia tambi&eacute;n al proceso de cierre de <I>gaps</I>, pero    esencialmente est&aacute; dedicado a corregir los errores que quedaron en el    ensamblaje, y errores de secuenciaci&oacute;n. Los m&eacute;todos <I>in silico</I>    empleados durante la fase de terminaci&oacute;n del genoma incrementan considerablemente    la posibilidad de cerrar el genoma, pero aun as&iacute;, cuando quedan <I>gaps</I>    entre los <I>contigs</I>, o las conexiones entre ellos son ambiguas, solo las    t&eacute;cnicas de laboratorio pueden ayudar. Entre las t&eacute;cnicas m&aacute;s    empleadas se encuentran &#171;<I>chromosome walking</I>&#187; (39), PCR m&uacute;ltiple    optimizado (40) asociado a secuenciaci&oacute;n Sanger, y la t&eacute;cnica    mapa &oacute;ptico (41, 42). Pero estas t&eacute;cnicas son muy laboriosas y    costosas. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>Anotaci&oacute;n    de genomas</B> </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Despu&eacute;s    de un exitoso ensamblaje del genoma, el pr&oacute;ximo reto consiste en interpretar    la informaci&oacute;n que contiene. Para ello es necesaria la identificaci&oacute;n    de las principales caracter&iacute;sticas del genoma, proceso conocido como    anotaci&oacute;n. La anotaci&oacute;n de genomas comprende dos etapas fundamentales:    la anotaci&oacute;n estructural (predicci&oacute;n de regiones codificantes)    y la anotaci&oacute;n funcional (asignaci&oacute;n de informaci&oacute;n biol&oacute;gica    a los genes previamente predichos). </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los m&eacute;todos    para la anotaci&oacute;n estructural en un genoma se dividen en dos categor&iacute;as:    m&eacute;todo <I>ab initio</I> o <I>de novo</I>, y m&eacute;todo por comparaci&oacute;n    (43). El m&eacute;todo <I>ab initio</I> utiliza algoritmos estad&iacute;sticos    o de reconocimiento de patrones para determinar si la secuencia de inter&eacute;s    es codificante o no, mediante la detecci&oacute;n de patrones o motivos espec&iacute;ficos    en la secuencia. Por otro lado, el m&eacute;todo por comparaci&oacute;n identifica    zonas de alta similitud en organismos relacionados o en bases de datos de prote&iacute;nas    para reconocer las regiones codificantes. Sin embargo, este m&eacute;todo es    menos exitoso en la identificaci&oacute;n de nuevos genes y en nuevos organismos,    ya que las bases de datos est&aacute;n sesgadas hacia los genes altamente expresados    en los organismos m&aacute;s estudiados. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para la anotaci&oacute;n    funcional, tambi&eacute;n se emplean distintos m&eacute;todos. La funci&oacute;n    de un gen se puede inferir mediante la b&uacute;squeda de secuencias hom&oacute;logas    en bases de datos, empleando algoritmos de alineamiento local, como <I>BLAST    </I>(44). Esta asignaci&oacute;n se realiza tomando como base la premisa de    que genes con secuencias compartidas, tambi&eacute;n comparten su funci&oacute;n.    Otra metodolog&iacute;a empleada es la b&uacute;squeda de motivos y dominios    funcionales. Aunque un dominio funcional no permite asignar un nombre directamente    al gen, s&iacute; puede dar una idea de la familia g&eacute;nica a la que pertenece    el gen, o indicar el grupo de procesos en los que pueda estar involucrado. </font>     <P>&nbsp; <H1> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B><font size="3">CONCLUSIONES</font></B>    </font></H1>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las NGS han tenido    un gran impacto en muchos campos de la biolog&iacute;a actual, permitiendo el    estudio simult&aacute;neo de varios microorganismos de inter&eacute;s. Sin embargo,    supone un gran reto desde el punto de vista computacional por el volumen de    datos que ofrece. No podemos referirnos a una tecnolog&iacute;a &#171;mejor&#187;    para la secuenciaci&oacute;n de genomas, ni tampoco a la &#171;mejor&#187; metodolog&iacute;a    para el ensamblaje de secuencias. En dependencia de las caracter&iacute;sticas    del microorganismo en cuesti&oacute;n, y del objetivo final de la investigaci&oacute;n,    se escoge la tecnolog&iacute;a para la secuenciaci&oacute;n y la subsiguiente    metodolog&iacute;a para el ensamblaje. Se han descrito m&uacute;ltiples aplicaciones    de la secuenciaci&oacute;n de genomas para el estudio de microorganismos pat&oacute;genos.    Entre ellos se destaca la resecuenciaci&oacute;n, mediante la cual se corrigen    errores o se completan secuencias gen&oacute;micas previamente obtenidas por    una tecnolog&iacute;a diferente. </font>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una vez obtenida    la secuencia gen&oacute;mica y anotados los genes que contiene, la misma constituye    una herramienta poderosa para la caracterizaci&oacute;n del microorganismo,    a trav&eacute;s de la identificaci&oacute;n de factores de virulencia, an&aacute;lisis    comparativos y filogen&eacute;ticos con otros microorganismos, estudio de redes    metab&oacute;licas, entre otros, as&iacute; como elementos que puedan contribuir    al diagn&oacute;stico, la prevenci&oacute;n y el control de la enfermedad que    produce el agente.</font>      ]]></body>
<body><![CDATA[<P>&nbsp;     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B><font size="3">REFERENCIAS</font></B>    </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1. Metzker ML.      Sequencing technologies - the next generation. Nat Rev Genet. 2010;11(1):31-46.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">2. Margulies      M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, et al. Genome sequencing      in microfabricated high-density picolitre reactors. Nature. 2005;437(7057):376-80.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">3. Bentley DR.      Whole-genome re-sequencing. Curr Opin Genet Dev. 2006;16(6):545-52.     </font>        <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">4. Pennisi E. Genomics.    Semiconductors inspire new sequencing technologies. Science. 2010;327(5970):1190.        </font>      ]]></body>
<body><![CDATA[<!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">5. Harris TD, Buzby    PR, Babcock H, Beer E, Bowers J, Braslavsky I, et al. Single-molecule DNA sequencing    of a viral genome. Science. 2008;320(5872):106-109.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">6. Eid J, Fehr    A, Gray J, Luong K, Lyle J, Otto G, et al. Real-time DNA sequencing from single    polymerase molecules. Science. 2009;323(5910):133-138.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">7. Treangen TJ,      Salzberg SL. Repetitive DNA and next-generation sequencing: computational      challenges and solutions. Nat Rev Genet. 2012;13(1):36-46.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">8. Sims D, Sudbery      I, Ilott NE, Heger A, Ponting CP. Sequencing depth and coverage: key considerations      in genomic analyses. Nat Rev Genet. 2014;15(2):121-32.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">9. Xu F, Miao      D, Du Y, Chen X, Zhang P, Sun H. Draft Genome Sequence of <I>Avibacterium      paragallinarum</I> Strain 221. Genome Announc. 2013;1(3).     </font>        ]]></body>
<body><![CDATA[<!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">10.Requena D, Chumbe    A, Torres M, Alzamora O, Ramirez M, Valdivia-Olarte H, et al. Genome sequence    and comparative analysis of <I>Avibacterium</I> <I>paragallinarum</I>. Bioinformation.    2013;9(10):528-536.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">11.Aguilar-Bultet      L, Calderon-Copete SP, Frey J, Falquet L. Draft Genome Sequence of the Virulent      <I>Avibacterium paragallinarum</I> Serotype A Strain JF4211 and Identification      of Two Toxins. Genome Announc. 2013;1(4).     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">12.Roodt Y. Towards      unravelling the genome of <I>Avibacterium paragallinarum</I>. Bloemfontein:      University of the Free State; 2009.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">13.Chen YC, Tan      DH, Shien JH, Hsieh MK, Yen TY, Chang PC. Identification and functional analysis      of the cytolethal distending toxin gene from <I>Avibacterium paragallinarum</I>.      Avian Pathol. 2014;43(1):43-50.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">14.Kung E, Frey      J. AvxA, a composite serine-protease-RTX toxin of <I>Avibacterium paragallinarum</I>.      Vet Microbiol. 2013;163(3-4):290-298.     </font>        ]]></body>
<body><![CDATA[<!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">15.Tewhey R, Gu    B, Kelesidis T, Charlton C, Bobenchik A, Hindler J, et al. Mechanisms of linezolid    resistance among coagulase-negative staphylococci determined by whole-genome    sequencing. mBio. 2014;5(3):e00894-14.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">16.Evans PS,      Luo Y, Muruvanda T, Ayers S, Hiatt B, Hoffman M, et al. Complete Genome Sequences      of Salmonella enterica Serovar Heidelberg Strains Associated with a Multistate      Food-Borne Illness Investigation. Genome Announc. 2014;2(3).     </font>        <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">17.Chen C, Zhang    W, Zheng H, Lan R, Wang H, Du P, et al. Minimum core genome sequence typing    of bacterial pathogens: a unified approach for clinical and public health microbiology.    Journal of clinical microbiology. 2013;51(8):2582-2591.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">18.Dupuy V, Manso-Silvan    L, Barbe V, Thebault P, Dordet-Frisoni E, Citti C, et al. Evolutionary history    of contagious bovine pleuropneumonia using next generation sequencing of <I>Mycoplasma    mycoides</I> subsp. <I>mycoides</I> Small Colony. PLoS One. 2012;7(10):e46821.        </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">19.Guimaraes      AM, Santos AP, SanMiguel P, Walter T, Timenetsky J, Messick JB. Complete genome      sequence of <I>Mycoplasma suis</I> and insights into its biology and adaption      to an erythrocyte niche. PLoS One. 2011;6(5):e19574.     </font>       ]]></body>
<body><![CDATA[<!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">20.Wajid B, Serpedin      E. Review of general algorithmic features for genome assemblers for next generation      sequencers. Genomics Proteomics Bioinformatics. 2012;10(2):58-73.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">21.Wooley JC,      Godzik A, Friedberg I. A primer on metagenomics. PLoS Comput Biol. 2010;6(2):e1000667.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">22.Chistoserdova      L. Recent progress and new challenges in metagenomics for biotechnology. Biotechnol      Lett. 2010;32(10):1351-1359.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">23.Guo Y, Ye      F, Sheng Q, Clark T, Samuels DC. Three-stage quality control strategies for      DNA re-sequencing data. Brief Bioinform. 2013.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">24.Chaisson MJ,      Tesler G. Mapping single molecule sequencing reads using basic local alignment      with successive refinement (BLASR): application and theory. BMC Bioinformatics.      2012;13:238.     </font>       ]]></body>
<body><![CDATA[<!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">25.Chin CS, Alexander      DH, Marks P, Klammer AA, Drake J, Heiner C, et al. Nonhybrid, finished microbial      genome assemblies from long-read SMRT sequencing data. Nat Methods. 2013;10(6):563-569.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">26.Schadt EE,      Turner S, Kasarskis A. A window into third-generation sequencing. Hum Mol      Genet. 2010;19(R2):R227-40.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">27.English AC,      Richards S, Han Y, Wang M, Vee V, Qu J, et al. Mind the gap: upgrading genomes      with Pacific Biosciences RS long-read sequencing technology. PLoS One. 2012;7(11):e47768.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">28.Falquet L,      Calderon-Copete SP, Frey J. Draft Genome Sequence of the Virulent <I>Clostridium      chauvoei</I> Reference Strain JF4335. Genome Announc. 2013;1(4).     </font>       <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">29.Satou K, Shiroma      A, Teruya K, Shimoji M, Nakano K, Juan A, et al. Complete Genome Sequences      of Eight <I>Helicobacter pylori</I> Strains with Different Virulence Factor      Genotypes and Methylation Profiles, Isolated from Patients with Diverse Gastrointestinal      Diseases on Okinawa Island, Japan, Determined Using PacBio Single-Molecule      Real-Time Technology. Genome Announc. 2014;2(2). </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">30.Nagarajan      N, Pop M. Sequence assembly demystified. Nat Rev Genet. 2013;14(3):157-167.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">31.Pop M. Genome      assembly reborn: recent computational challenges. Brief Bioinform. 2009;10(4):354-366.          </font>        <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">32.Pevzner PA,    Tang H, Waterman MS. An Eulerian path approach to DNA fragment assembly. Proc    Natl Acad Sci USA. 2001;98(17):9748-9753.     </font>      <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">33.Pop M, Kosack      DS, Salzberg SL. Hierarchical scaffolding with Bambus. Genome Res. 2004;14(1):149-159.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">34.Myers EW,      Sutton GG, Delcher AL, Dew IM, Fasulo DP, Flanigan MJ, et al. A whole-genome      assembly of Drosophila. Science. 2000;287(5461):2196-2204.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">35.Zerbino DR,      Birney E. Velvet: algorithms for de novo short read assembly using de Bruijn      graphs. Genome Res. 2008;18(5):821-829.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">36.Batzoglou      S, Jaffe DB, Stanley K, Butler J, Gnerre S, Mauceli E, et al. ARACHNE: a whole-genome      shotgun assembler. Genome Res. 2002;12(1):177-189.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">37.Phillippy      AM, Schatz MC, Pop M. Genome assembly forensics: finding the elusive mis-assembly.      Genome Biol. 2008;9(3):R55.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">38.Meader S,      Hillier LW, Locke D, Ponting CP, Lunter G. Genome assembly quality: assessment      and improvement using the neutral indel model. Genome Res. 2010;20(5):675-684.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">39.Wang Z, Ye      S, Li J, Zheng B, Bao M, Ning G. Fusion primer and nested integrated PCR (FPNI-PCR):      a new high-efficiency strategy for rapid chromosome walking or flanking sequence      cloning. BMC Biotechnol. 2011;11:109.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">40.Tettelin H,      Radune D, Kasif S, Khouri H, Salzberg SL. Optimized multiplex PCR: efficiently      closing a whole-genome shotgun sequencing project. Genomics. 1999;62(3):500-507.          </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">41.Nagarajan      N, Read TD, Pop M. Scaffolding and validation of bacterial genome assemblies      using optical restriction maps. Bioinformatics. 2008;24(10):1229-1235.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">42.Samad AH,      Cai WW, Hu X, Irvin B, Jing J, Reed J, et al. Mapping the genome one molecule      at a time--optical mapping. Nature. 1995;378(6556):516-517.     </font>       <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">43.Harrow J,      Nagy A, Reymond A, Alioto T, Patthy L, Antonarakis SE, et al. Identifying      protein-coding genes in genomic sequences. Genome Biol. 2009;10(1):201.     </font>        <!-- ref --><P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">44.Altschul SF,    Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J    Mol Biol. 1990;215(3):403-410.     </font>      <P>&nbsp;     ]]></body>
<body><![CDATA[<P>&nbsp;     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Recibido: 30-9-2014.    <br>   </font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Aceptado:    2-3-2015.</font>       ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Metzker]]></surname>
<given-names><![CDATA[ML]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequencing technologies - the next generation]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2010</year>
<volume>11</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>31-46</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Margulies]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Egholm]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Altman]]></surname>
<given-names><![CDATA[WE]]></given-names>
</name>
<name>
<surname><![CDATA[Attiya]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Bader]]></surname>
<given-names><![CDATA[JS]]></given-names>
</name>
<name>
<surname><![CDATA[Bemben]]></surname>
<given-names><![CDATA[LA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genome sequencing in microfabricated high-density picolitre reactors]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2005</year>
<volume>437</volume>
<numero>7057</numero>
<issue>7057</issue>
<page-range>376-80</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bentley]]></surname>
<given-names><![CDATA[DR]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Whole-genome re-sequencing]]></article-title>
<source><![CDATA[Curr Opin Genet Dev]]></source>
<year>2006</year>
<volume>16</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>545-52</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pennisi]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genomics: Semiconductors inspire new sequencing technologies]]></article-title>
<source><![CDATA[Science]]></source>
<year>2010</year>
<volume>327</volume>
<numero>5970</numero>
<issue>5970</issue>
<page-range>1190</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Harris]]></surname>
<given-names><![CDATA[TD]]></given-names>
</name>
<name>
<surname><![CDATA[Buzby]]></surname>
<given-names><![CDATA[PR]]></given-names>
</name>
<name>
<surname><![CDATA[Babcock]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Beer]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Bowers]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Braslavsky]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Single-molecule DNA sequencing of a viral genome]]></article-title>
<source><![CDATA[Science]]></source>
<year>2008</year>
<volume>320</volume>
<numero>5872</numero>
<issue>5872</issue>
<page-range>106-109</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eid]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Fehr]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Gray]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Luong]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Lyle]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Otto]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real-time DNA sequencing from single polymerase molecules]]></article-title>
<source><![CDATA[Science]]></source>
<year>2009</year>
<volume>323</volume>
<numero>5910</numero>
<issue>5910</issue>
<page-range>133-138</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Treangen]]></surname>
<given-names><![CDATA[TJ]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Repetitive DNA and next-generation sequencing: computational challenges and solutions]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2012</year>
<volume>13</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>36-46</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sims]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Sudbery]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Ilott]]></surname>
<given-names><![CDATA[NE]]></given-names>
</name>
<name>
<surname><![CDATA[Heger]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Ponting]]></surname>
<given-names><![CDATA[CP]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequencing depth and coverage: key considerations in genomic analyses]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2014</year>
<volume>15</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>121-32</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xu]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Miao]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Du]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Sun]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Draft Genome Sequence of Avibacterium paragallinarum Strain 221]]></article-title>
<source><![CDATA[Genome Announc]]></source>
<year>2013</year>
<volume>1</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Requena]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Chumbe]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Torres]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Alzamora]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
<name>
<surname><![CDATA[Ramirez]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Valdivia-Olarte]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genome sequence and comparative analysis of Avibacterium paragallinarum]]></article-title>
<source><![CDATA[Bioinformation]]></source>
<year>2013</year>
<volume>9</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>528-536</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aguilar-Bultet]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Calderon-Copete]]></surname>
<given-names><![CDATA[SP]]></given-names>
</name>
<name>
<surname><![CDATA[Frey]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Falquet]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Draft Genome Sequence of the Virulent Avibacterium paragallinarum Serotype A Strain JF4211 and Identification of Two Toxins]]></article-title>
<source><![CDATA[Genome Announc]]></source>
<year>2013</year>
<volume>1</volume>
<numero>4</numero>
<issue>4</issue>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Roodt]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Towards unravelling the genome of Avibacterium paragallinarum]]></source>
<year>2009</year>
<publisher-name><![CDATA[University of the Free State]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[YC]]></given-names>
</name>
<name>
<surname><![CDATA[Tan]]></surname>
<given-names><![CDATA[DH]]></given-names>
</name>
<name>
<surname><![CDATA[Shien]]></surname>
<given-names><![CDATA[JH]]></given-names>
</name>
<name>
<surname><![CDATA[Hsieh]]></surname>
<given-names><![CDATA[MK]]></given-names>
</name>
<name>
<surname><![CDATA[Yen]]></surname>
<given-names><![CDATA[TY]]></given-names>
</name>
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[PC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Identification and functional analysis of the cytolethal distending toxin gene from Avibacterium paragallinarum]]></article-title>
<source><![CDATA[Avian Pathol]]></source>
<year>2014</year>
<volume>43</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>43-50</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kung]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Frey]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[AvxA, a composite serine-protease-RTX toxin of Avibacterium paragallinarum]]></article-title>
<source><![CDATA[Vet Microbiol]]></source>
<year>2013</year>
<volume>163</volume>
<numero>3-4</numero>
<issue>3-4</issue>
<page-range>290-298</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tewhey]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Gu]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Kelesidis]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Charlton]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Bobenchik]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Hindler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mechanisms of linezolid resistance among coagulase-negative staphylococci determined by whole-genome sequencing]]></article-title>
<source><![CDATA[mBio]]></source>
<year>2014</year>
<volume>5</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>e00894-14</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Evans]]></surname>
<given-names><![CDATA[PS]]></given-names>
</name>
<name>
<surname><![CDATA[Luo]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Muruvanda]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Ayers]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Hiatt]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Hoffman]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Complete Genome Sequences of Salmonella enterica Serovar Heidelberg Strains Associated with a Multistate Food-Borne Illness Investigation]]></article-title>
<source><![CDATA[Genome Announc]]></source>
<year>2014</year>
<volume>2</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Zheng]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Lan]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Du]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Minimum core genome sequence typing of bacterial pathogens: a unified approach for clinical and public health microbiology]]></article-title>
<source><![CDATA[Journal of clinical microbiology]]></source>
<year>2013</year>
<volume>51</volume>
<numero>8</numero>
<issue>8</issue>
<page-range>2582-2591</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dupuy]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Manso-Silvan]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Barbe]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Thebault]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Dordet-Frisoni]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Citti]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evolutionary history of contagious bovine pleuropneumonia using next generation sequencing of Mycoplasma mycoides subsp. mycoides Small Colony]]></article-title>
<source><![CDATA[PLoS One]]></source>
<year>2012</year>
<volume>7</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>e46821</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guimaraes]]></surname>
<given-names><![CDATA[AM]]></given-names>
</name>
<name>
<surname><![CDATA[Santos]]></surname>
<given-names><![CDATA[AP]]></given-names>
</name>
<name>
<surname><![CDATA[SanMiguel]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Walter]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Timenetsky]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Messick]]></surname>
<given-names><![CDATA[JB]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Complete genome sequence of Mycoplasma suis and insights into its biology and adaption to an erythrocyte niche]]></article-title>
<source><![CDATA[PLoS One]]></source>
<year>2011</year>
<volume>6</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>e19574</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wajid]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Serpedin]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Review of general algorithmic features for genome assemblers for next generation sequencers]]></article-title>
<source><![CDATA[Genomics Proteomics Bioinformatics]]></source>
<year>2012</year>
<volume>10</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>58-73</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wooley]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
<name>
<surname><![CDATA[Godzik]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Friedberg]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A primer on metagenomics]]></article-title>
<source><![CDATA[PLoS Comput Biol]]></source>
<year>2010</year>
<volume>6</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>e1000667</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chistoserdova]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Recent progress and new challenges in metagenomics for biotechnology]]></article-title>
<source><![CDATA[Biotechnol Lett]]></source>
<year>2010</year>
<volume>32</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>1351-1359</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guo]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Ye]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Sheng]]></surname>
<given-names><![CDATA[Q]]></given-names>
</name>
<name>
<surname><![CDATA[Clark]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Samuels]]></surname>
<given-names><![CDATA[DC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Three-stage quality control strategies for DNA re-sequencing data]]></article-title>
<source><![CDATA[Brief Bioinform]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chaisson]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
<name>
<surname><![CDATA[Tesler]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mapping single molecule sequencing reads using basic local alignment with successive refinement (BLASR): application and theory]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2012</year>
<volume>13</volume>
<page-range>238</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chin]]></surname>
<given-names><![CDATA[CS]]></given-names>
</name>
<name>
<surname><![CDATA[Alexander]]></surname>
<given-names><![CDATA[DH]]></given-names>
</name>
<name>
<surname><![CDATA[Marks]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Klammer]]></surname>
<given-names><![CDATA[AA]]></given-names>
</name>
<name>
<surname><![CDATA[Drake]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Heiner]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data]]></article-title>
<source><![CDATA[Nat Methods]]></source>
<year>2013</year>
<volume>10</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>563-569</page-range></nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schadt]]></surname>
<given-names><![CDATA[EE]]></given-names>
</name>
<name>
<surname><![CDATA[Turner]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Kasarskis]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A window into third-generation sequencing]]></article-title>
<source><![CDATA[Hum Mol Genet]]></source>
<year>2010</year>
<volume>19</volume>
<numero>R2</numero>
<issue>R2</issue>
<page-range>R227-40</page-range></nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[English]]></surname>
<given-names><![CDATA[AC]]></given-names>
</name>
<name>
<surname><![CDATA[Richards]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Han]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Vee]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Qu]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mind the gap: upgrading genomes with Pacific Biosciences RS long-read sequencing technology]]></article-title>
<source><![CDATA[PLoS One]]></source>
<year>2012</year>
<volume>7</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>e47768</page-range></nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Falquet]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Calderon-Copete]]></surname>
<given-names><![CDATA[SP]]></given-names>
</name>
<name>
<surname><![CDATA[Frey]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Draft Genome Sequence of the Virulent Clostridium chauvoei Reference Strain JF4335]]></article-title>
<source><![CDATA[Genome Announc]]></source>
<year>2013</year>
<volume>1</volume>
<numero>4</numero>
<issue>4</issue>
</nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Satou]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Shiroma]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Teruya]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Shimoji]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Nakano]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Juan]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Complete Genome Sequences of Eight Helicobacter pylori Strains with Different Virulence Factor Genotypes and Methylation Profiles, Isolated from Patients with Diverse Gastrointestinal Diseases on Okinawa Island, Japan, Determined Using PacBio Single-Molecule Real-Time Technology]]></article-title>
<source><![CDATA[Genome Announc]]></source>
<year>2014</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>0</page-range></nlm-citation>
</ref>
<ref id="B30">
<label>30</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nagarajan]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequence assembly demystified]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2013</year>
<volume>14</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>157-167</page-range></nlm-citation>
</ref>
<ref id="B31">
<label>31</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genome assembly reborn: recent computational challenges]]></article-title>
<source><![CDATA[Brief Bioinform]]></source>
<year>2009</year>
<volume>10</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>354-366</page-range></nlm-citation>
</ref>
<ref id="B32">
<label>32</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pevzner]]></surname>
<given-names><![CDATA[PA]]></given-names>
</name>
<name>
<surname><![CDATA[Tang]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Waterman]]></surname>
<given-names><![CDATA[MS]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Eulerian path approach to DNA fragment assembly]]></article-title>
<source><![CDATA[Proc Natl Acad Sci USA]]></source>
<year>2001</year>
<volume>98</volume>
<numero>17</numero>
<issue>17</issue>
<page-range>9748-9753</page-range></nlm-citation>
</ref>
<ref id="B33">
<label>33</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Kosack]]></surname>
<given-names><![CDATA[DS]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hierarchical scaffolding with Bambus]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2004</year>
<volume>14</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>149-159</page-range></nlm-citation>
</ref>
<ref id="B34">
<label>34</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Myers]]></surname>
<given-names><![CDATA[EW]]></given-names>
</name>
<name>
<surname><![CDATA[Sutton]]></surname>
<given-names><![CDATA[GG]]></given-names>
</name>
<name>
<surname><![CDATA[Delcher]]></surname>
<given-names><![CDATA[AL]]></given-names>
</name>
<name>
<surname><![CDATA[Dew]]></surname>
<given-names><![CDATA[IM]]></given-names>
</name>
<name>
<surname><![CDATA[Fasulo]]></surname>
<given-names><![CDATA[DP]]></given-names>
</name>
<name>
<surname><![CDATA[Flanigan]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A whole-genome assembly of Drosophila]]></article-title>
<source><![CDATA[Science]]></source>
<year>2000</year>
<volume>287</volume>
<numero>5461</numero>
<issue>5461</issue>
<page-range>2196-2204</page-range></nlm-citation>
</ref>
<ref id="B35">
<label>35</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zerbino]]></surname>
<given-names><![CDATA[DR]]></given-names>
</name>
<name>
<surname><![CDATA[Birney]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Velvet: algorithms for de novo short read assembly using de Bruijn graphs]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2008</year>
<volume>18</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>821-829</page-range></nlm-citation>
</ref>
<ref id="B36">
<label>36</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Batzoglou]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Jaffe]]></surname>
<given-names><![CDATA[DB]]></given-names>
</name>
<name>
<surname><![CDATA[Stanley]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Butler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Gnerre]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mauceli]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[ARACHNE: a whole-genome shotgun assembler]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2002</year>
<volume>12</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>177-189</page-range></nlm-citation>
</ref>
<ref id="B37">
<label>37</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Phillippy]]></surname>
<given-names><![CDATA[AM]]></given-names>
</name>
<name>
<surname><![CDATA[Schatz]]></surname>
<given-names><![CDATA[MC]]></given-names>
</name>
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genome assembly forensics: finding the elusive mis-assembly]]></article-title>
<source><![CDATA[Genome Biol]]></source>
<year>2008</year>
<volume>9</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>R55</page-range></nlm-citation>
</ref>
<ref id="B38">
<label>38</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Meader]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Hillier]]></surname>
<given-names><![CDATA[LW]]></given-names>
</name>
<name>
<surname><![CDATA[Locke]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Ponting]]></surname>
<given-names><![CDATA[CP]]></given-names>
</name>
<name>
<surname><![CDATA[Lunter]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genome assembly quality: assessment and improvement using the neutral indel model]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2010</year>
<volume>20</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>675-684</page-range></nlm-citation>
</ref>
<ref id="B39">
<label>39</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Ye]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Zheng]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Bao]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Ning]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fusion primer and nested integrated PCR (FPNI-PCR): a new high-efficiency strategy for rapid chromosome walking or flanking sequence cloning]]></article-title>
<source><![CDATA[BMC Biotechnol]]></source>
<year>2011</year>
<volume>11</volume>
<page-range>109</page-range></nlm-citation>
</ref>
<ref id="B40">
<label>40</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tettelin]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Radune]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Kasif]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Khouri]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Optimized multiplex PCR: efficiently closing a whole-genome shotgun sequencing project]]></article-title>
<source><![CDATA[Genomics]]></source>
<year>1999</year>
<volume>62</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>500-507</page-range></nlm-citation>
</ref>
<ref id="B41">
<label>41</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nagarajan]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Read]]></surname>
<given-names><![CDATA[TD]]></given-names>
</name>
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Scaffolding and validation of bacterial genome assemblies using optical restriction maps]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2008</year>
<volume>24</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>1229-1235</page-range></nlm-citation>
</ref>
<ref id="B42">
<label>42</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Samad]]></surname>
<given-names><![CDATA[AH]]></given-names>
</name>
<name>
<surname><![CDATA[Cai]]></surname>
<given-names><![CDATA[WW]]></given-names>
</name>
<name>
<surname><![CDATA[Hu]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Irvin]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Jing]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Reed]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mapping the genome one molecule at a time--optical mapping]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1995</year>
<volume>378</volume>
<numero>6556</numero>
<issue>6556</issue>
<page-range>516-517</page-range></nlm-citation>
</ref>
<ref id="B43">
<label>43</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Harrow]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Nagy]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Reymond]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Alioto]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Patthy]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Antonarakis]]></surname>
<given-names><![CDATA[SE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Identifying protein-coding genes in genomic sequences]]></article-title>
<source><![CDATA[Genome Biol]]></source>
<year>2009</year>
<volume>10</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>201</page-range></nlm-citation>
</ref>
<ref id="B44">
<label>44</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Altschul]]></surname>
<given-names><![CDATA[SF]]></given-names>
</name>
<name>
<surname><![CDATA[Gish]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Miller]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Myers]]></surname>
<given-names><![CDATA[EW]]></given-names>
</name>
<name>
<surname><![CDATA[Lipman]]></surname>
<given-names><![CDATA[DJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Basic local alignment search tool]]></article-title>
<source><![CDATA[J Mol Biol]]></source>
<year>1990</year>
<volume>215</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>403-410</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
