<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992016000300012</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Selección de Base de Datos No SQL para almacenamiento de Históricos en Sistemas de Supervisión]]></article-title>
<article-title xml:lang="en"><![CDATA[No SQL Database selection for historical storage in supervision and control systems]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rodríguez Pérez]]></surname>
<given-names><![CDATA[Aylin]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rodríguez Hernández]]></surname>
<given-names><![CDATA[Dairon]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Díaz Martínez]]></surname>
<given-names><![CDATA[Elizabeth]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2016</year>
</pub-date>
<volume>10</volume>
<numero>3</numero>
<fpage>159</fpage>
<lpage>170</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992016000300012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992016000300012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992016000300012&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN El almacenamiento y procesamiento de históricos para sistemas de supervisión y control en escenarios industriales muestran problemáticas ante el manejo de grandes volúmenes de datos gestionados con el modelo relacional. La presente investigación tiene como objetivos analizar el estado actual de estos sistemas de supervisión y control, sus ventajas y desventajas, y realizar un estudio del arte para la selección de una base de datos No SQL para el registro de series de tiempo. El desarrollo del trabajo se centró en la comparación de los gestores de almacenamiento Orientados a Columnas que son: HBase, Cassandra y Big Table. Este último fue eliminado de la comparación detallada pues su licencia es propietaria. Luego de diseñar e implementar dos casos de pruebas para comparar el comportamiento de ambos gestores ante los escenarios de Lecturas Intensivas y Lectura/Escritura, se concluyó que ambos poseen excelentes prestaciones para el almacenamiento de históricos. Se sugiere, el análisis y desarrollo de pruebas específicas acorde al dominio de aplicación de estas dos tecnologías.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The storage and processing for historical supervisory and control systems in industrial settings to show problems handling large volumes of data managed by the relational model. This research aims to analyze the current state of these supervisory and control systems, their advantages and disadvantages and make an art studio for a lesson is-not sql data base for recording time series. The development work focused on comparing storage managers oriented columns are: Hbase, Cassandra and Big Table. The latter was removed from the detailed comparison because it&#8217;s proprietary license. After design and implement two test cases to compare the performance of both managers to the stage and intensive reading / writing reading was concluded that both have excellent facilities for the storage of historical. It is suggested, analysis and development according to specific application domain evidence of these two technologies.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[base de datos]]></kwd>
<kwd lng="es"><![CDATA[históricos]]></kwd>
<kwd lng="es"><![CDATA[no SQL]]></kwd>
<kwd lng="es"><![CDATA[supervisión y control]]></kwd>
<kwd lng="en"><![CDATA[databases]]></kwd>
<kwd lng="en"><![CDATA[historical]]></kwd>
<kwd lng="en"><![CDATA[no SQL]]></kwd>
<kwd lng="en"><![CDATA[supervisory and control]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Selecci&oacute;n  de Base de Datos No SQL para almacenamiento de Hist&oacute;ricos en Sistemas de  Supervisi&oacute;n</font></strong></font></p>     <p>&nbsp;</p>     <p><strong><font size="3" face="Verdana, Arial, Helvetica, sans-serif">No SQL Database  selection for historical storage in supervision and control systems</font></strong></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Aylin Rodr&iacute;guez P&eacute;rez<strong><sup>1*</sup></strong>,Dairon Rodr&iacute;guez Hern&aacute;ndez<strong><sup>1</sup></strong></font></strong></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif">,<strong> Elizabeth D&iacute;az Mart&iacute;nez<strong><sup>1</sup></strong></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Universidad de las Ciencias Inform&aacute;ticas, Cuba, {arodriguezp, daironrh, edmartinez}@uci.cu</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">    ]]></body>
<body><![CDATA[<br> </font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span><a href="mailto:aarencibia@uci.cu"><font size="2">arodriguezp@uci.cu</font></a></font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  almacenamiento y procesamiento de hist&oacute;ricos para sistemas de supervisi&oacute;n y  control en escenarios industriales muestran problem&aacute;ticas ante el manejo de  grandes vol&uacute;menes de datos gestionados con el modelo relacional. La presente  investigaci&oacute;n tiene como objetivos analizar el estado actual de estos sistemas  de supervisi&oacute;n y control, sus ventajas y desventajas, y realizar un estudio del  arte para la selecci&oacute;n de una base de datos No SQL para el registro de series  de tiempo. El desarrollo del trabajo se centr&oacute; en la comparaci&oacute;n de los  gestores de almacenamiento Orientados a Columnas que son: HBase, Cassandra y Big Table. Este &uacute;ltimo fue eliminado de la comparaci&oacute;n detallada pues  su licencia es propietaria. Luego de dise&ntilde;ar e implementar dos casos de pruebas  para comparar el comportamiento de ambos gestores ante los escenarios de  Lecturas Intensivas y Lectura/Escritura, se concluy&oacute; que ambos poseen  excelentes prestaciones para el almacenamiento de hist&oacute;ricos. Se sugiere, el  an&aacute;lisis y desarrollo de pruebas espec&iacute;ficas acorde al dominio de aplicaci&oacute;n de  estas dos tecnolog&iacute;as. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave: </span></b>base de datos, hist&oacute;ricos, no SQL, supervisi&oacute;n y control.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The storage and processing for historical  supervisory and  control systems in industrial settings to show problems handling large volumes  of data managed by the relational model. This research aims to analyze the  current state of these supervisory and control systems, their advantages and  disadvantages and make an art studio for a lesson is-not sql data base for  recording time series. The development work focused on comparing storage  managers oriented columns are: Hbase, Cassandra and Big Table. The latter was  removed from the detailed comparison because it&rsquo;s proprietary license. After  design and implement two test cases to compare the performance of both managers  to the stage and intensive reading / writing reading was concluded that both  have excellent facilities for the storage of historical. It is suggested,  analysis and development according to specific application domain evidence of  these two technologies.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>databases,  historical, no SQL, supervisory and control.</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  almacenamiento de la informaci&oacute;n hist&oacute;rica consiste en el registro de grandes  concentraciones de datos, a partir de muestras de informaci&oacute;n emitidas por  determinado sistema. Las bases de datos hist&oacute;ricas juegan un papel clave en los  sistemas de control industrial, quienes almacenan, procesan y proveen la  informaci&oacute;n necesaria para las tareas de supervisi&oacute;n, registro de eventos,  gesti&oacute;n y mantenimiento en el sector industrial. (Bitincka, 2010)</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Entre los  principales retos de las bases de datos hist&oacute;ricas se destaca el manejo de  grandes vol&uacute;menes de informaci&oacute;n, de modo que permita realizar funciones como  el registro, lectura, procesamiento y compresi&oacute;n de la informaci&oacute;n con  adecuados niveles de escalabilidad. La escalabilidad es la propiedad de los  sistemas inform&aacute;ticos que estudia su comportamiento durante su crecimiento  continuo. (Hyuck, 2011)</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para los sistemas de control esta cualidad es  inherente al proceso de mantenimiento y actualizaci&oacute;n de la plataforma acorde a los requerimientos del negocio. Las labores de incorporaci&oacute;n  de nuevos dispositivos de control, as&iacute; como las reestructuraciones de  infraestructura y administrativas en las &aacute;reas operacionales, convierten a las  industrias en un escenario complejo para la evoluci&oacute;n de los sistemas  inform&aacute;ticos. (Ombergen, 2014) </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  almacenamiento de hist&oacute;ricos se ha realizado desde los a&ntilde;os 80 fundamentalmente  con tecnolog&iacute;as de bases de datos relacionales, sin embargo, el modelo  relacional introduce limitantes derivadas de su propia concepci&oacute;n que coadyuvan  a un comportamiento ineficiente cuando los sistemas crecen, que se manifiesta  con la reducci&oacute;n significativa del rendimiento y la disponibilidad para la  gesti&oacute;n de series de tiempo (Strauch,  2011). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la &uacute;ltima d&eacute;cada han surgido nuevas tendencias y tecnolog&iacute;as de  almacenamiento que encaran estas problem&aacute;ticas, entre ellas las conocidas Base  de Datos NoSQL. Estos proponen una estructura de persistencia m&aacute;s vers&aacute;til,  aunque en algunos casos se pierden ciertas funcionalidades como las  transacciones y la incapacidad de hacer uniones de tablas.&nbsp; Entre sus principales atributos se destacan  la ausencia de esquema en los registros de datos, escalabilidad horizontal  sencilla y velocidad (Strauch, 2011). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El presente art&iacute;culo realiza una investigaci&oacute;n de las tecnolog&iacute;as NoSQL  con el objetivo de seleccionar un gestor de base de datos acorde a los  requerimientos para el almacenamiento de hist&oacute;ricos en sistemas de supervisi&oacute;n  y control industrial para entornos cr&iacute;ticos donde se requieran sistemas en  tiempo real blando (<em>Soft Real Time  Systems</em>). (Laplante, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El desarrollo abarca el an&aacute;lisis de las diversas estructuras de las  bases de datos No SQL, la definici&oacute;n de los atributos que guiar&aacute;n el proceso de  selecci&oacute;n, la comparaci&oacute;n y su fundamentaci&oacute;n.</font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><strong><font size="3" face="Verdana, Arial, Helvetica, sans-serif">MATERIALES Y M&Eacute;TODOS </font></strong></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">M&eacute;todos Te&oacute;ricos:</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Hist&oacute;rico-l&oacute;gico</strong>: se utiliza para el estudio  de los distintos sistemas gestores de base de datos NoSQL </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>An&aacute;lisis-S&iacute;ntesis</strong>: se requiere para el  estudio de la informaci&oacute;n sobre NoSQL, que permita su desglose progresivo y el  resumen para arribar a ideas generales.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>M&eacute;todos Emp&iacute;ricos:</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Observaci&oacute;n</strong>: utilizado como medio para la  adquisici&oacute;n de conocimientos, en los intercambios realizados con el personal del  Centro de Inform&aacute;tica Industrial (CEDIN).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Estructuras de las No SQL</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las bases de datos No SQL implementan diferentes estructuras de  almacenamiento, las m&aacute;s extendidas son Clave-Valor, Columnas, Documentos y  Grafos (L&oacute;pez, 2013). En la <strong><a href="/img/revistas/rcci/v10n3/t0112316.jpg" target="_blank">Tabla 1</a></strong> se presenta un resumen de sus  principales caracter&iacute;sticas, el desarrollo de esta investigaci&oacute;n se centrar&aacute; en  las bases de datos orientadas a columnas, las cuales son las m&aacute;s utilizadas para el registro de  actividades de monitoreo y series de tiempo. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Factores comparativos </strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tomando como fundamento los requerimientos de las bases de datos  hist&oacute;ricas para sistemas de supervisi&oacute;n y control, se identificaron las  caracter&iacute;sticas que ser&aacute;n el centro del an&aacute;lisis para confeccionar la matriz  comparativa que guiar&aacute; el proceso de selecci&oacute;n de la tecnolog&iacute;a. En la <strong><a href="/img/revistas/rcci/v10n3/t0212316.jpg" target="_blank">Tabla 2</a></strong> se muestran los principales  factores y su descripci&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Tecnolog&iacute;as a comparar</strong>    <br> Una vez definidos los atributos que guiar&aacute;n la comparaci&oacute;n se realiz&oacute; un  estudio del arte de los principales gestores existentes orientados a columnas (Strauch, 2011), ( G&oacute;mez, 2012), resultando <em>HBase</em>, <em>Cassandra</em> y <em>Big Table</em> los seleccionados. A continuaci&oacute;n, se realizar&aacute; una  descripci&oacute;n de sus principales caracter&iacute;sticas para conformar la tabla  comparativa de las tecnolog&iacute;as.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em><strong>HBase</strong></em></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El almacenamiento de datos es orientado a columnas y comprende un  conjunto de tablas que contienen filas y columnas. Cada tabla debe tener una  clave principal, una columna representa un atributo de un objeto.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>HBase</em> permite muchos atributos para ser  agrupados juntos en lo que se conoce como familias de columna, los elementos de  una familia columna se almacenan todos juntos. Con <em>HBase</em> se debe definir previamente el esquema de la tabla y  especificar las familias de columnas (Strauch, 2011), ( G&oacute;mez, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>HBase</em> es como un clon de Big<em> Table</em> desarrollado  en <em>Java</em> como parte de <em>Apache-MapReduce</em> marco <em>Hadoop</em>, proporcionando  un &quot;modo de alta disponibilidad de almacenar grandes cantidades de datos dispersos&quot; (Grehan, 2014). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>HBase</em> depende de un sistema de archivos distribuido (HDFS). En este sistema existe la  necesidad de compactaciones, compresi&oacute;n de datos, as&iacute; como filtros para la reducci&oacute;n del acceso  al disco. <em>HBase</em> puede ser una fuente o un destino  para los trabajos <em>MapReduce</em> ejecutado a trav&eacute;s de <em>Hadoop</em>. El uso notable de <em>HBase</em> es el sistema de mensajer&iacute;a en tiempo real de <em>Facebook</em> construido  sobre <em>HBase</em> desde 2010 ( G&oacute;mez, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Big Table</em></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Es un  sistema de almacenamiento distribuido para  gestionar datos estructurados y  puede escalar a un tama&ntilde;o muy  grande como: <em>petabytes</em> de datos a trav&eacute;s de miles de  servidores de productos b&aacute;sicos. Google  a partir de 2006 lo emplea en sus proyectos (Birgen, 2014). </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Ha  obtenido hasta el momento relevantes resultados como aplicabilidad amplia, escalabilidad, alto rendimiento y alta  disponibilidad. Para <em>Google</em> la implementaci&oacute;n de <em>Big Table</em> tiene  demostrado ser ventajosa, pues es impredecible la  flexibilidad con la que se ha desarrollado (Strauch, 2011). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tiene otras caracter&iacute;sticas como: distribuido, de alta eficiencia y  propietario. Est&aacute; construido sobre GFS (<em>Google File System</em>), <em>Chubby Lock Service</em>, y algunos otros  servicios y programas de Google (Strauch, 2011).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Comenz&oacute; a  partir de 2004. Este gestor almacena la informaci&oacute;n en tablas  multidimensionales. Las celdas disponen de versiones temporales de sus valores,  por lo que se puede hacer un seguimiento de los valores hist&oacute;ricos (Birgen, 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Cassandra</em></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como gestor de  base de datos est&aacute; determinado por su escalabilidad  y alta disponibilidad sin comprometer el rendimiento. Tiene adem&aacute;s gran escalabilidad lineal y  probada tolerancia a fallos en el  hardware.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tambi&eacute;n brinda apoyo para replicar a trav&eacute;s de m&uacute;ltiples centros de datos  y es el mejor en su clase,  proporcionando una menor latencia para  los usuarios y la tranquilidad  de saber que usted puede sobrevivir  cortes regionales. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Cassandra</em> tiene caracter&iacute;sticas como &iacute;ndices de columna con el desempe&ntilde;o de estructuradas actualizaciones,  soporte firme para las vistas  materializadas y potente capacidad de  almacenamiento en cach&eacute; (Lakshman,  2010) </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Permite el uso eficiente para muchas aplicaciones m&aacute;s all&aacute; de simple clave / valor. La lectura y escritura  tiene gran rendimiento tanto en forma  lineal a medida que se a&ntilde;aden nuevas m&aacute;quinas, sin ning&uacute;n tiempo de inactividad o  interrupci&oacute;n de las aplicaciones. Adem&aacute;s,  es adecuado para aplicaciones que no pueden permitirse el lujo de perder los datos, incluso cuando un centro de datos deja de funcionar ( G&oacute;mez, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Cassandra</em> tiene integraci&oacute;n <em>Hadoop</em>, <em>MapReduce</em> con apoyo. Est&aacute; conformada por familias de columna que contienen filas y columnas y a su vez cada fila se  identifica por una  clave. Cada fila tiene varias columnas, cada una de ellas tiene un nombre, valor y marca de tiempo ( G&oacute;mez, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para lograr una alta escalabilidad y la durabilidad de un cl&uacute;ster de <em>Cassandra</em>, los datos se replican en un n&uacute;mero de nodos que se  pueden definir como un factor de replicaci&oacute;n por ejemplo <em>Cassandra</em>.  La replicaci&oacute;n est&aacute; gestionada por  un nodo coordinador de la tecla en particular se est&aacute; modificando,  el nodo coordinador para cualquier clave es el primer nodo en el  anillo consistente hash que  es visitado al caminar desde la posici&oacute;n de la llave en el anillo en la direcci&oacute;n de las agujas del reloj (Cattell,  2011).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En comparaci&oacute;n con <em>Big Table</em> y <em>HBase</em>, <em>Cassandra</em> persiste sus datos  a archivos locales en lugar de un distribuido sistema de archivos. Sin embargo, la representaci&oacute;n  de los datos en la memoria y en  el disco, as&iacute; como el procesamiento  de lectura y operaciones de escritura  es tomada de <em>Big Table</em>. Las operaciones de escritura  primero van a un registro  de confirmaci&oacute;n persistente y  luego a una estructura de datos  en memoria. A continuaci&oacute;n, se muestra en la <strong><a href="/img/revistas/rcci/v10n3/t0312316.jpg" target="_blank">Tabla 3</a></strong> un resumen de los factores y su aplicaci&oacute;n en cada gestor. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Luego de realizar un primer an&aacute;lisis partiendo de las caracter&iacute;sticas  descritas en el apartado 2.3, descartamos <em>Big  Table</em> debido a su licencia propietaria. La comparaci&oacute;n de los factores para <em>HBase</em> y <em>Cassandra</em> arroja resultados similares sin grandes diferencias  significativas para decidir la selecci&oacute;n. Por lo tanto, se procede a realizar  un an&aacute;lisis m&aacute;s profundo del comportamiento de estos gestores antes  determinados escenarios de uso.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Comparativas (Bechmark)</strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta secci&oacute;n se realizar&aacute; un an&aacute;lisis m&aacute;s detallado de las  tecnolog&iacute;as <em>Hbase</em> y <em>Cassandra</em>. Dos de los casos de uso m&aacute;s  utilizados para la gesti&oacute;n de datos hist&oacute;ricos son la Escritura y  Escritura/Lectura. A continuaci&oacute;n, se describe en detalle las pruebas de  rendimiento aplicadas y sus resultados.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Lectura</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este escenario tiene como objetivo probar el comportamiento de los dos  gestores ante la lectura intensiva. Para ello se implementa un caso de prueba  que realizar&aacute; el 95% de lecturas y 5% de escrituras durante 10 minutos, se  utilizar&aacute;n 10 millones de registros para cada nodo, tomando como referencia la  investigaci&oacute;n ( G&oacute;mez Villamor, et al., 2012). Se limitar&aacute;n las  pruebas a 1 y 3 estaciones que son los el m&iacute;nimo y m&aacute;ximo de nodos que  usualmente se usan en el sector para las tareas de supervisi&oacute;n y control. En la <strong><a href="/img/revistas/rcci/v10n3/t0412316.jpg" target="_blank">Tabla 4</a></strong> se muestran los  resultados obtenidos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Analizando los resultados obtenidos se puede concluir parcialmente que <em>Cassandra</em> brinda mejores prestaciones  que <em>HBase</em> para la lectura intensiva.  En el caso de la <em>Tasa de Transferencia y  Lectura</em> muestra valores superiores alrededor de 10 veces, sin embargo, en  la Escritura ocurre lo contrario, aunque las muestras de <em>HBase</em> son excelentes en este rubro las de <em>Cassandra</em> son adecuadas para el dominio de aplicaci&oacute;n de nuestro  inter&eacute;s, que se limita a aplicaciones de tiempo real blando (Laplante, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Lectura / Escritura</strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este escenario tiene como objetivo probar el comportamiento de los dos  gestores ante el balance de lectura y escritura. Para ello se implementa un  caso de prueba que realizar&aacute; el 50% de lecturas y 50% de escrituras. En la <strong><a href="/img/revistas/rcci/v10n3/t0512316.jpg" target="_blank">Tabla 5</a></strong>, se muestran los resultados  obtenidos.</font> </p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Nuevamente ante las pruebas de Lectura/Escritura se obtienen resultados  similares a la prueba precedente. <em>Cassandra</em> supera ampliamente en la Tasa de Transferencia y Lectura quedando por debajo en  la Latencia durante la Escritura, aunque con niveles muy buenos acordes a los  requerimientos del dominio de aplicaci&oacute;n.</font><font size="2"> </font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Luego del desarrollo de los puntos 2,3 y 4 se puede argumentar que <em>HBase</em> y <em>Cassandra</em> son excelentes tecnolog&iacute;as para gestionar grandes vol&uacute;menes  de datos y el desarrollo de aplicaciones de monitoreo y control.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Ambos presentan magn&iacute;ficas prestaciones e implementan funcionalidades  claves para su actividad como los altos niveles de consistencia y  disponibilidad respectivamente. De igual modo destacan sus capacidades para la  replicaci&oacute;n, tolerancia a fallas y sus niveles de escalabilidad horizontal.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Independientemente de sus semejantes prestaciones. <em>Cassandra</em> resalt&oacute; en las pruebas de lectura intensiva y lectura  escritura, adem&aacute;s se comprob&oacute; la facilidad de asimilar su estructura y esquema  de trabajo, ello propici&oacute; la agilizaci&oacute;n del proceso de instalaci&oacute;n y  configuraci&oacute;n de las pruebas, incluyendo productivas experiencias para extender  la plataforma e incorporar nuevas funcionalidades. Igualmente destac&oacute; su  escalabilidad en cl&uacute;steres peque&ntilde;os.</font> </p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los sistemas de bases de datos han dado un giro significativo en la  &uacute;ltima d&eacute;cada. Una muestra de ello ha sido el desarrollo de nuevos modelos de  almacenamiento como las bases de datos No SQL, que se han consolidado  exitosamente en determinados dominios como las redes sociales y otras  aplicaciones donde los datos crecen con gran velocidad.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Centrado en los gestores de almacenamiento Orientados a Columnas fueron  seleccionados <em>HBase</em>, <em>Cassandra</em> y <em>Big Table</em>. Este &uacute;ltimo fue eliminado de la comparaci&oacute;n detallada  pues su licencia es propietaria. Luego de dise&ntilde;ar e implementar dos casos de  pruebas para comparar el comportamiento de ambos gestores ante los escenarios  de Lecturas Intensivas y Lectura/Escriturase concluy&oacute; que ambos poseen excelentes prestaciones para el almacenamiento  de hist&oacute;ricos. Se sugiere, el an&aacute;lisis y desarrollo de pruebas espec&iacute;ficas  acorde al dominio de aplicaci&oacute;n de estas dos tecnolog&iacute;as.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A pesar de ello <em>Cassandra</em> present&oacute; un predominio en factores como la Tasa de Transferencia y Latencia en  la lectura, adem&aacute;s posee una estructura de f&aacute;cil asimilaci&oacute;n para su  instalaci&oacute;n y administraci&oacute;n, as&iacute; como una gran comunidad, documentaci&oacute;n y  capacidades de extensi&oacute;n que le hacen m&aacute;s atractivo y pr&aacute;ctico de usar. </font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BIRGEN, CANSU. <em>SQL vs. NoSQL</em>. Documento. Advanced Simulation, 2014. [Consultado  el: 20 de enero de 2016]. Disponible en: [<a href="http://folk.ntnu.no/preisig/HAP_Specials/AdvancedSimulation_files/2014/AdvSim-2014__Birgen_Cansu_Databases.pdf">http://folk.ntnu.no/preisig/HAP_Specials/AdvancedSimulation_files/2014/AdvSim-2014__Birgen_Cansu_Databases.pdf</a>.    ]</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LAKSHMAN, AVINASH Y MALIK, PRASHANT <em>Cassandra: a decentralized  structured storage system.</em>. ACM SIGOPS Operating Systems  Review, 2010, Vol. 44 (2): p.  35-40. ISSN: 0163-5980.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GREHAN, RICK . 2014. <em>Apache HBase offers  extreme scalability, reliability, and flexibility, but at the cost of many  moving parts</em>. Documento. INFOWORLD<em>. </em>[En l&iacute;nea] 31 de  Marzo de 2014. [Consultado el: 20 Febrero del 2016]. Disponible en: [http://www.infoworld.com/article/2610709/database/review--hbase-is-massively  scalable and-hugely-complex.html.    ]</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HYUCK HAN, SANG Y KUK KIM, YOUNG. 2011. <em>An Architecture of Real-Time, Historical Database  System for Industrial Process Control and Monitoring</em>. IEEE, Computer  Society. [En l&iacute;nea] Mayo de 2011. Disponible  en: [https://www.computer.org/csdl/proceedings/cnsi/2011/4417/00/4417a031.pdf.]  ISBN: 978-0-7695-4417-5.    </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">L&Oacute;PEZ IPI&Ntilde;A, DIEGO . 2013. <em>Conceptos b&aacute;sicos de NoSQL. Introducci&oacute;n a  Cassandra, CouchDB, MongoDB y Neo4j. </em>Santiago de Compostela, Universidade  de Santiago de Compostela, Espa&ntilde;a&nbsp;: s.n., 17 de Julio de 2013.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">OMBERGEN, STEVEN VAN. <em>A Comparison  of Five Document-Store Query Languages. </em>2014. [En l&iacute;nea,  Consultado el: 25 de Febrero del 2016]. Disponible en: [http://dare.uva.nl/cgi/arno/show.cgi?fid=524062.    ]</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BITINCKA, LEDION , y otros<em>. Optimizing data analysis with a semi-structured time  series database</em>. 2010. s.l.&nbsp;:  USENIX Association Berkeley, CA, USA, 2010, ACM/Digital Library, p&aacute;gs. 3-37.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LAPLANTE, PHILLIP A<em>. Real-Time Systems Design and Analysis: An Engineer's  Handbook.</em>. 2012. s.l.&nbsp;: Wiley-IEEE Press, ACM/Digital Library,  p&aacute;g. 384. ISBN:0780334000.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CATTELL, RICK<em>. Scalable SQL and NoSQL data stores. </em>2011. 4, New York&nbsp;: s.n., 6 de Mayo de 2011, SIGMOD ACM Special Interest  Group on Management of Data , Vol. 39, p&aacute;gs. 12-27 . ISSN: 0163-5808.    </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">G&Oacute;MEZ VILLAMOR, SERGIO , y  otros<em>. Solving big data challenges  for enterprise application performance management.</em>.  2012.  s.l.&nbsp;: Publications by Affiliated Organizations , 1 de Agosto de 2012,  ACM/Digital Library, Vol. 5 , p&aacute;gs. 1724-1735. ISSN: 2150-8097.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">STRAUCH, CHRISTOF . 2011. <em>Selected Topics  on Software-Technology</em>. [En l&iacute;nea] 2011. [Consultado el: 10 Diciembre del 2015]. Disponible en: [http://www.odbms.org/2014/03/nosql-databases-2/.    ] </font></p>     <p>&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 25/03/2016    <br> Aceptado: 30/06/2016</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BIRGEN]]></surname>
</name>
</person-group>
<source><![CDATA[SQL vs. NoSQL]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LAKSHMAN]]></surname>
<given-names><![CDATA[AVINASH]]></given-names>
</name>
<name>
<surname><![CDATA[MALIK]]></surname>
<given-names><![CDATA[PRASHANT]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Cassandra: a decentralized structured storage system]]></article-title>
<source><![CDATA[]]></source>
<year>2010</year>
<volume>Vol. 44</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>p. 35-40</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GREHAN]]></surname>
<given-names><![CDATA[RICK]]></given-names>
</name>
</person-group>
<source><![CDATA[HBase offers extreme scalability, reliability, and flexibility, but at the cost of many moving parts.]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HYUCK HAN]]></surname>
<given-names><![CDATA[SANG]]></given-names>
</name>
<name>
<surname><![CDATA[KUK KIM]]></surname>
<given-names><![CDATA[YOUNG]]></given-names>
</name>
</person-group>
<source><![CDATA[An Architecture of Real-Time, Historical Database System for Industrial Process Control and Monitoring]]></source>
<year>2011</year>
<publisher-name><![CDATA[IEEE, Computer Society]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LÓPEZ IPIÑA]]></surname>
<given-names><![CDATA[DIEGO]]></given-names>
</name>
</person-group>
<source><![CDATA[Conceptos básicos de NoSQL. Introducción a Cassandra, CouchDB, MongoDB y Neo4j]]></source>
<year>2013</year>
<publisher-loc><![CDATA[^eSantiago de Compostela Santiago de Compostela]]></publisher-loc>
<publisher-name><![CDATA[Universidade de Santiago de Compostela]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[OMBERGEN]]></surname>
<given-names><![CDATA[STEVEN VAN]]></given-names>
</name>
</person-group>
<source><![CDATA[A Comparison of Five Document-Store Query Languages]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BITINCKA]]></surname>
<given-names><![CDATA[LEDION]]></given-names>
</name>
</person-group>
<source><![CDATA[Optimizing data analysis with a semi-structured time series database]]></source>
<year>2010</year>
<page-range>págs. 3-37</page-range><publisher-loc><![CDATA[^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[USENIX Association Berkeley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LAPLANTE]]></surname>
<given-names><![CDATA[PHILLIP]]></given-names>
</name>
</person-group>
<source><![CDATA[A. Real-Time Systems Design and Analysis: An Engineer's Handbook]]></source>
<year>2012</year>
<page-range>pág. 384</page-range><publisher-name><![CDATA[Wiley-IEEE Press, ACM/Digital Library]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CATTELL]]></surname>
<given-names><![CDATA[RICK]]></given-names>
</name>
</person-group>
<source><![CDATA[Scalable SQL and NoSQL data stores]]></source>
<year>2011</year>
<volume>Vol. 39</volume>
<page-range>12-27</page-range><publisher-loc><![CDATA[^eNew York New York]]></publisher-loc>
<publisher-name><![CDATA[SIGMOD ACM Special Interest Group on Management of Data]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GÓMEZ VILLAMOR]]></surname>
<given-names><![CDATA[SERGIO]]></given-names>
</name>
</person-group>
<source><![CDATA[Solving big data challenges for enterprise application performance management..]]></source>
<year>2012</year>
<volume>Vol. 5</volume>
<page-range>1724-1735</page-range><publisher-name><![CDATA[Publications by Affiliated Organizations]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STRAUCH]]></surname>
<given-names><![CDATA[CHRISTOF]]></given-names>
</name>
</person-group>
<source><![CDATA[Selected Topics on Software-Technology]]></source>
<year>2011</year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
