<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992014000100004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Generación de resúmenes escalables de video]]></article-title>
<article-title xml:lang="en"><![CDATA[Generating scalable video summaries]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Díaz-Berenguer]]></surname>
<given-names><![CDATA[Abel]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Centro de Geoinformática y Señales Digitales Departamento de Señales Digitales]]></institution>
<addr-line><![CDATA[La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>03</month>
<year>2014</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>03</month>
<year>2014</year>
</pub-date>
<volume>8</volume>
<numero>1</numero>
<fpage>33</fpage>
<lpage>41</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992014000100004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992014000100004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992014000100004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Los procedimientos para la generación de resúmenes de video, permiten obtener una secuencia sintetizada de la información contenida en el mismo. En este contexto la duración del resumen juega un papel fundamental pues en ocasiones se desean sinopsis con mayor o menor longitud, por lo que los resúmenes escalables permiten dar respuesta a esta necesidad. En el presente trabajo se expone un procedimiento desarrollado con el objetivo de obtener resúmenes escalables de videos según la duración de los mismos. El procedimiento se basa en un proceso de creación del resumen con etapas bien establecidas que garantizan la generación eficiente del mismo. Los resultados muestran la compatibilidad con diversos formatos de codificación, generándose eficazmente los resúmenes para varias longitudes. La eficacia del procedimiento, confirmada con los resultados del trabajo, garantiza sus potencialidades de aplicación en sistemas para la gestión, procesamiento y transmisión de materiales audiovisuales]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Procedures for generating video summaries, allows to obtain a synthesized sequence of the information contained in a video. In this context, the summary duration plays an important role because sometime summaries with varying duration are needed, so the scalable summaries allow to respond to this necessity. In the present work a new procedure is proposed, which has been developed with the aim of obtaining scalable summaries according to their duration. The procedure developed is based on a summary creation process with very well established stages for an efficient generation of it. The results obtained show compatibility with various encoding formats, what generates summaries for various lengths in an efficient way. The effectiveness of the procedure, confirmed by means of the work results already obtained, guarantees its application potentialities in systems developed for managing, processing and transmission of audiovisual materials.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Escalable]]></kwd>
<kwd lng="es"><![CDATA[procedimiento]]></kwd>
<kwd lng="es"><![CDATA[resumen]]></kwd>
<kwd lng="es"><![CDATA[video]]></kwd>
<kwd lng="en"><![CDATA[Procedure]]></kwd>
<kwd lng="en"><![CDATA[scalable]]></kwd>
<kwd lng="en"><![CDATA[summary]]></kwd>
<kwd lng="en"><![CDATA[video]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO    ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4" face="Verdana, Arial, Helvetica, sans-serif"><b>Generaci&oacute;n    de res&uacute;menes escalables de video</b></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><b><font size="3">Generating    scalable video summaries</font></b></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><b><font size="2">Abel D&iacute;az    Berenguer</font></b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Centro de Geoinform&aacute;tica    y Se&ntilde;ales Digitales. Departamento de Se&ntilde;ales Digitales. Universidad    de las Ciencias Inform&aacute;ticas, Carretera a San Antonio de los Ba&ntilde;os,    km 2 &frac12;, Torrens, Boyeros, La Habana, Cuba. CP.: 19370</font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">*<b>Autor para    la correspondencia</b>: <a href="mailto:aberenguer@uci.cu">aberenguer@uci.cu</a></font>      ]]></body>
<body><![CDATA[<P>&nbsp;      <P>      <P>&nbsp;</p> <hr>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>RESUMEN</B></font>      <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los procedimientos    para la generaci&oacute;n de res&uacute;menes de video, permiten obtener una    secuencia sintetizada de la informaci&oacute;n contenida en el mismo. En este    contexto la duraci&oacute;n del resumen juega un papel fundamental pues en ocasiones    se desean sinopsis con mayor o menor longitud, por lo que los res&uacute;menes    escalables permiten dar respuesta a esta necesidad. En el presente trabajo se    expone un procedimiento desarrollado con el objetivo de obtener res&uacute;menes    escalables de videos seg&uacute;n la duraci&oacute;n de los mismos. El procedimiento    se basa en un proceso de creaci&oacute;n del resumen con etapas bien establecidas    que garantizan la generaci&oacute;n eficiente del mismo. Los resultados muestran    la compatibilidad con diversos formatos de codificaci&oacute;n, gener&aacute;ndose    eficazmente los res&uacute;menes para varias longitudes. La eficacia del procedimiento,    confirmada con los resultados del trabajo, garantiza sus potencialidades de    aplicaci&oacute;n en sistemas para la gesti&oacute;n, procesamiento y transmisi&oacute;n    de materiales audiovisuales.</font>      <P><font face="Verdana, Arial, Helvetica, sans-serif"><B><font size="2">Palabras    clave: </font></B><font size="2">Escalable, procedimiento, resumen, video.</font></font></P> <hr>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><font size="2"><B>ABSTRACT</b></font>    </font></p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Procedures for    generating video summaries, allows to obtain a synthesized sequence of the information    contained in a video. In this context, the summary duration plays an important    role because sometime summaries with varying duration are needed, so the scalable    summaries allow to respond to this necessity. In the present work a new procedure    is proposed, which has been developed with the aim of obtaining scalable summaries    according to their duration. The procedure developed is based on a summary creation    process with very well established stages for an efficient generation of it.    The results obtained show compatibility with various encoding formats, what    generates summaries for various lengths in an efficient way. The effectiveness    of the procedure, confirmed by means of the work results already obtained, guarantees    its application potentialities in systems developed for managing, processing    and transmission of audiovisual materials. </font>      <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><B>Key words: </B>Procedure,    scalable, summary, video.</font></P> <hr>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>INTRODUCCI&Oacute;N</b></font>  </p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En los &uacute;ltimos    a&ntilde;os se ha evidenciado un notable aumento de la producci&oacute;n y distribuci&oacute;n    de contenidos audiovisuales. Estudios realizados demuestran que los usuarios    de internet prefieren, en su mayor&iacute;a, consumir los archivos audiovisuales    disponibles en la red (Maass, et al., 2005; L&oacute;pez, et al., 2011); sitios    como YouTube, dedicados a compartir materiales audiovisuales en la red, diariamente    reciben m&aacute;s de dos millones de visitas (Gramsci, 2011). Lo anterior,    unido al incremento de las capacidades de c&oacute;mputo y almacenamiento de    los sistemas, ha impuesto el reto de perfeccionar los ambientes de producci&oacute;n,    distribuci&oacute;n y recuperaci&oacute;n de contenido audiovisual, pues se    predice que contin&uacute;e aumentando la demanda de estos contenidos (Cisco,    2012).</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El acceso al contenido    multimedia es una actividad cada vez m&aacute;s dif&iacute;cil, por lo general    implica un proceso de pre-visualizaci&oacute;n del video por parte del usuario,    que debe emplear determinado tiempo en esta tarea. En este contexto las t&eacute;cnicas    de procesamiento de video se han convertido en una necesidad ante el volumen    de materiales audiovisuales existentes. Varias investigaciones se han dedicado    a establecer procedimientos para describir, procesar, almacenar y recuperar    informaci&oacute;n del contenido audiovisual. Como parte de estos se pueden    observar los que procesan el contenido de un video con la finalidad de generar    autom&aacute;ticamente res&uacute;menes del mismo (Truong, et al., 2007). Los    procedimientos para generar res&uacute;menes autom&aacute;ticos del video permiten    crear una representaci&oacute;n visual compactada de la informaci&oacute;n en    el video, es decir, proporcionan una secuencia sintetizada, pero con las representaciones    del contenido original (Truong, et al., 2007; Vald&eacute;s, et al., 2008; Over    et al., 2008; Herranz, 2010; Wan, et al., 2010).</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los procedimientos    que generan sinopsis de videos est&aacute;n dise&ntilde;ados para facilitar    la navegaci&oacute;n sobre una base de datos de videos. Adem&aacute;s se pueden    utilizar los res&uacute;menes obtenidos como un producto final, que garantice    al usuario acceder r&aacute;pidamente a posiciones sem&aacute;nticas relevantes    en la secuencia (Berkhin, 2006; Truong, et al., 2007). La mayor&iacute;a de    los algoritmos desarrollados en este &aacute;mbito generan la salida de un &uacute;nico    resumen. Esto puede ser insuficiente, ya que en ocasiones es deseable una representaci&oacute;n    personalizada para cada usuario y los res&uacute;menes escalables resultan &uacute;tiles    para hacer frente a la diversidad de preferencias y lograr mayor usabilidad.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La creaci&oacute;n    de algoritmos que permitan obtener res&uacute;menes de video escalables, despierta    cierto inter&eacute;s en investigadores de la tem&aacute;tica (Benini, et al.,    2006a; Benini, et al., 2006b; Zhu, 2004; Herranz, et al., 2010; Herranz, 2010).    Se asume por resumen escalable el caso en que es posible adaptar la sinopsis    obtenida a determinadas preferencias o condiciones; por ejemplo, la resoluci&oacute;n,    la tasa de bits por segundo y la longitud o la duraci&oacute;n. Para lograr    este objetivo los procedimientos que generan res&uacute;menes escalables deben    garantizar la posibilidad de generar varias secuencias sintetizadas dependiendo    de las condiciones o preferencias establecidas. En el presente trabajo, se asume    la escalabilidad como la capacidad del procedimiento para devolver como salida    varios res&uacute;menes con distintas duraciones para una misma secuencia original.    Como antecedentes de esta investigaci&oacute;n se pueden observar las aproximaciones    encaminadas a lograr res&uacute;menes de varias escalas (Zhu, 2004; Benini et    al., 2006a; Benini et al., 2006b; Herranz et al., 2010; Herranz, 2010).</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las aproximaciones    mencionadas anteriormente poseen buenos resultados aunque presentan dificultades,    Zhu y sus colaboradores (Zhu, 2004) asumen la escalabilidad para cada estructura    jer&aacute;rquica con la limitante de que los res&uacute;menes no son escalables    dentro de cada nivel. Adem&aacute;s a consideraci&oacute;n del autor de este    art&iacute;culo un resumen escalable deber&iacute;a lograr mayor n&uacute;mero    de escalas para adaptarse a situaciones en las que la duraci&oacute;n del mismo    puede limitarse a un valor espec&iacute;fico.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por su parte la    principal desventaja de las investigaciones presentadas por Benini, (Benini,    et al., 2006a; Benini et al., 2006b), radica en que se requiere una etapa de    procesamiento a priori antes de la anotaci&oacute;n de la secuencia, para establecer    el umbral a trav&eacute;s del que se establece la prioridad de las tomas a representar.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En el caso de los    resultados presentados en las investigaciones de Herranz (Herranz, et al., 2010;    Herranz Arribas, 2010) se evidencia un procedimiento ajustado a un dominio restringido    de codificaci&oacute;n de video que es basado en est&aacute;ndares MPEG (Mitchell,    et al., 1996). Este procedimiento se centra en las caracter&iacute;sticas propias    del flujo de datos de las codificaciones MPEG, lo que limita su utilizaci&oacute;n    en otros dominios de codificaci&oacute;n. A pesar de las dificultades de los    trabajos analizados, seg&uacute;n las consideraciones del autor de este art&iacute;culo,    los conceptos de escalabilidad y resumen embebido planteados en esta aproximaci&oacute;n    (Herranz, et al., 2010; Herranz, 2010) constituyen los m&aacute;s aceptados    para la creaci&oacute;n de res&uacute;menes escalables de video.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El desarrollo de    la presente investigaci&oacute;n tiene sus or&iacute;genes en la construcci&oacute;n    por parte de la Universidad de las Ciencias Inform&aacute;ticas de aplicaciones    inform&aacute;ticas para la gesti&oacute;n, procesamiento y transmisi&oacute;n    de contenido audiovisual. Estas aplicaciones se caracterizan por el constante    aumento de la cantidad y diversidad de materiales audiovisuales gestionados    y posteriormente almacenados para su utilizaci&oacute;n. Los materiales audiovisuales    gestionados no necesariamente se codifican en un formato establecido, pues esto    depende de los requisitos establecidos por los clientes potenciales.</font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por otra parte    en las aplicaciones de gesti&oacute;n, procesamiento y transmisi&oacute;n de    contenido audiovisual se debe garantizar el proceso de catalogaci&oacute;n de    los materiales audiovisuales gestionados para facilitar su b&uacute;squeda y    correcta utilizaci&oacute;n. Se han desarrollado algoritmos para lograr la catalogaci&oacute;n    semiautom&aacute;tica, pero muchas veces contin&uacute;a siendo necesaria la    anotaci&oacute;n manual de determinados datos. En este proceso, los usuarios    obtienen las perspectivas del contenido audiovisual navegando, en ocasiones    aleatoriamente, sobre las secuencias de video. Adicionalmente en dichas aplicaciones    se persigue el objetivo de proveer a los usuarios de materiales audiovisuales    disponibles en la web para consumir bajo demanda. Es com&uacute;n notar en los    usuarios que consumen videos, generalmente de larga duraci&oacute;n, que antes    de proceder a la visualizaci&oacute;n completa del material, realizan una pre-visualizaci&oacute;n    del mismo para obtener una idea de su contenido y posteriormente visualizarlo    completamente si lo consideran de su agrado.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Lo expuesto anteriormente    revela la necesidad de un mecanismo para obtener varias secuencias sintetizadas    con la informaci&oacute;n significativa de un mismo video, favoreciendo el proceso    de catalogaci&oacute;n y pre-visualizaci&oacute;n de materiales audiovisuales    en sistemas de gesti&oacute;n, procesamiento y transmisi&oacute;n de archivos    audiovisuales. En el presente trabajo se expone un procedimiento desarrollado    para generar res&uacute;menes escalables de videos. </font></p>     <p>&nbsp;</p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><B><font size="3">MATERIALES    Y M&Eacute;TODOS</font></B></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Creaci&oacute;n    del resumen autom&aacute;tico de video</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La creaci&oacute;n    de res&uacute;menes de video involucra diversos niveles de complejidad, en el    presente trabajo se asumen los resultados del estudio realizado por (Vald&eacute;s,    et al., 2008), donde se evidencia la secuencia de etapas necesarias para lograr    un resumen de video. En el siguiente esquema (<a href="#f01">Figura 1</a>) se    muestra la secuencia de pasos computacionales que permiten transformar una secuencia    de video de entrada en un resumen de la misma.</font></p>     <p align="center"><font face="Verdana, Arial, Helvetica, sans-serif"><a name="f01"></a><img src="img/revistas/rcci/v8n1/f0104114.jpg" width="586" height="249"></font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Etapa    de an&aacute;lisis</b></font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En    la etapa de an&aacute;lisis se realizan las operaciones destinadas a extraer    los descriptores visuales de la secuencia original con el objetivo de obtener    una lista con los datos y los descriptores asociados a las tomas. En esta etapa    se decodifica el video y se extraen los fotogramas del mismo. Una vez capturados    los fotogramas se procede a la primera fase para segmentar el video, la detecci&oacute;n    de tomas mediante histogramas (Yinzi, 2010; D&iacute;az, 2011; Boullosa, 2011).    Este se divide en cuatro pasos:</font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1.    Calcular el histograma de cada fotograma.    ]]></body>
<body><![CDATA[<br>   2. Comparar cada fotograma con el contiguo y guardar los resultados.    <br>   3. Establecer un umbral entre las comparaciones.    <br>   4. Detectar todas las comparaciones que sobrepasen este umbral como un cambio    de toma.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este punto el    video ya ha sido segmentado utilizando histogramas de color pero este procedimiento    de detecci&oacute;n de tomas es muy sensible a los cambios de iluminaci&oacute;n.    Por esta raz&oacute;n se efect&uacute;a la detecci&oacute;n mediante bordes    a los fotogramas que representan el cambio de una toma a otra (Lienhart, 2001;    Besc&oacute;s et al., 2005; Yinzi, 2010). Esta segunda fase de detecci&oacute;n    se logra a trav&eacute;s de la ejecuci&oacute;n de los siguientes pasos:</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1. Convertir los    fotogramas a escala de grises.    <br>   2. Realizar un desenfoque gaussiano.    <br>   3. Aplicar una funci&oacute;n de detecci&oacute;n de bordes.    <br>   4. Expandir las l&iacute;neas resultantes.    <br>   5. Comparar los resultados.    <br>   6. Establecer un umbral con las comparaciones.    ]]></body>
<body><![CDATA[<br>   7. Detectar los falsos positivos de la etapa anterior.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Despu&eacute;s    de haber efectuado la detecci&oacute;n mediante histogramas y bordes todav&iacute;a    pueden existir cortes dentro de una toma que no se hayan detectado. Esta es    la raz&oacute;n por la cual se utiliza el descriptor SURF (Bay, et al., 2006)    para aquellos l&iacute;mites entre tomas que como resultado del an&aacute;lisis    de histogramas pertenezcan a un margen dudoso (Berkhin, 2006; Lienhart, 2001;    Besc&oacute;s, et al., 2005; Tuytelaars, et al., 2007). La ejecuci&oacute;n    de esta tercera fase de detecci&oacute;n se logra mediante los siguientes pasos:</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1. Extraer las    caracter&iacute;sticas.    <br>   2. Obtener los descriptores.    <br>   3. Buscar coincidencias entre fotogramas.    <br>   4. Umbralizar el resultado.    <br>   5. Detectar falsos positivos de la etapa anterior.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Finalmente como    resultado de esta etapa se obtiene una lista con los datos relativos a la toma:</font></p> <ul>       <li><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Posici&oacute;n      inicial.</font></li>       <li><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Longitud.</font></li>       ]]></body>
<body><![CDATA[<li><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Fotograma clave.</font></li>       <li><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Umbral del Histograma      de color.</font></li>       <li><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Umbral del SURF</font></li>     </ul>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La etapa de an&aacute;lisis    constituye la etapa cr&iacute;tica para todo el proceso, pues la lista resultante    es almacenada y constituye la entrada para la etapa de generaci&oacute;n. Adem&aacute;s    el an&aacute;lisis no se ejecutar&aacute; nuevamente pues aunque se requiera    generar otro resumen esto se garantiza con los datos almacenados. Se analiza    una vez y se genera tantas veces como sea necesario, es decir la etapa solamente    se realizar&aacute; la primera vez que se requiera un resumen, luego se garantiza    la escalabilidad ejecutando la etapa de generaci&oacute;n varias veces. Seguidamente    se explica la generaci&oacute;n en detalles.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Generaci&oacute;n    escalable</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la etapa de    generaci&oacute;n radica la mayor complejidad para la creaci&oacute;n del resumen    de video. Por esta raz&oacute;n se ha dividido esta etapa en dos: clasificaci&oacute;n    y selecci&oacute;n (Vald&eacute;s et al., 2008). Durante la clasificaci&oacute;n    se proporciona una calificaci&oacute;n a cada toma, atendiendo a las caracter&iacute;sticas    analizadas anteriormente. En la etapa de selecci&oacute;n se determina cu&aacute;l    o cu&aacute;les de las tomas, deben incluirse en el resumen de video a generar,    y cu&aacute;l o cu&aacute;les pueden obviarse atendiendo a la clasificaci&oacute;n    realizada previamente.     <br>   </font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En    el trabajo se asumen los criterios de escalabilidad expuestos en (Herranz, et    al., 2010; Herranz, 2010) donde se define que un resumen escalable es aquel    que se constituye mediante un grupo de sumarios embebidos, <img src="img/revistas/rcci/v8n1/fo0104114.png" width="159" height="23">    donde<img src="img/revistas/rcci/v8n1/fo0204114.png" width="31" height="23"> denota la escala    del resumen y L la longitud del mismo. A su vez se hace necesario el cumplimiento    de la siguiente restricci&oacute;n <img src="img/revistas/rcci/v8n1/fo0304114.png" width="139" height="23">    considerando que cada sumario de menor escala es embebido en el sumario de escala    superior. Como se puede apreciar el sumario de mayor longitud se conforma mediante    la agrupaci&oacute;n de los sumarios de menor longitud, por lo que se debe lograr    una jerarqu&iacute;a en la que el sumario de menor longitud garantice la mayor    representatividad de la secuencia original.</font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En    esta etapa se persigue obtener, las tomas m&aacute;s representativas del video,    buscando eliminar la redundancia ofreciendo la mayor cantidad de informaci&oacute;n    posible. Con los resultados del an&aacute;lisis de histograma de color y SURF    se confecciona una matriz de proximidad (Berkhin, 2006), esta matriz es utilizada    posteriormente para crear un grupo de K cl&uacute;ster <img src="img/revistas/rcci/v8n1/fo0404114.png" width="103" height="23">    seg&uacute;n las distancias entre cada par de tomas <img src="img/revistas/rcci/v8n1/fo0504114.png" width="45" height="23">    agrup&aacute;ndose las tomas con caracter&iacute;sticas similares. Luego para    cada cl&uacute;ster <img src="img/revistas/rcci/v8n1/fo0604114.png" width="15" height="23">    las tomas m&aacute;s cercanas al centroide, determinadas por una puntuaci&oacute;n    establecida seg&uacute;n su duraci&oacute;n y variabilidad en el grupo, se consideran    las m&aacute;s representativas del grupo, lo que les establece mayor prioridad    para incluir en el resumen, conform&aacute;ndose la jerarqu&iacute;a necesaria    para lograr la escalabilidad (Dumont, et al., 2008; Xu et al., 2009).</font></p>     ]]></body>
<body><![CDATA[<p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para    la generaci&oacute;n final del resumen se asumen las dos modalidades para la    representaci&oacute;n de los res&uacute;menes de video que se pueden observar    com&uacute;nmente:</font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1.    Res&uacute;menes construidos con im&aacute;genes est&aacute;ticas, que constituyen    una representaci&oacute;n de los fotogramas relevantes, extra&iacute;dos de    la secuencia de video original para mostrar el contenido de la misma a trav&eacute;s    de un gui&oacute;n gr&aacute;fico est&aacute;tico, lo que com&uacute;nmente    se conocen como storyboard. Esta modalidad es definida en (Truong, et al., 2007)    de la siguiente forma:<img src="img/revistas/rcci/v8n1/fo0704114.png" width="225" height="23">    donde <img src="img/revistas/rcci/v8n1/fo0804114.png" width="60" height="23"> constituye el    procedimiento de extracci&oacute;n de los fotogramas claves al video V,obteni&eacute;ndose    una representaci&oacute;n R constituida por los fotogramas <img src="img/revistas/rcci/v8n1/fo1004114.png" width="90" height="23">.</font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">2.    Res&uacute;menes que se componen de peque&ntilde;os segmentos de video. Esta    modalidad de resumen consiste en un conjunto de segmentos de video que se extraen    del video original, los cuales se agrupan ya sea por un corte o a trav&eacute;s    de un efecto gradual de transici&oacute;n para obtener un video de menor tama&ntilde;o    que el original. En este caso se constituye un peque&ntilde;o video conocido    como skiming de video. El skiming de video es definido en (Truong et al., 2007)    de la siguiente forma:<img src="img/revistas/rcci/v8n1/fo1104114.png" width="213" height="23">    donde <img src="img/revistas/rcci/v8n1/fo1204114.png" width="36" height="23"> constituye el    procedimiento de generaci&oacute;n del skim del video V,<img src="img/revistas/rcci/v8n1/fo0904114.png" width="40" height="23">    es el fragmento i&eacute;simo a incluir en el video skim y U la operaci&oacute;n    de integraci&oacute;n obteni&eacute;ndose una representaci&oacute;n K, constituida    por la integraci&oacute;n de los segmentos <img src="img/revistas/rcci/v8n1/fo1304114.png" width="86" height="23">.    Esta integraci&oacute;n se realiza siguiendo el flujo temporal del video original    y la operaci&oacute;n de integraci&oacute;n utilizada es una transici&oacute;n    de desaparici&oacute;n simple.</font></p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Esta    etapa es ejecutada para obtener res&uacute;menes con la longitud deseada, por    tanto, se puede repetir todas las veces que sea necesario, para garantizar las    condiciones de escalabilidad.</font></p>     <p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>RESULTADOS Y    DISCUSI&Oacute;N</B></font>      <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Pruebas de compatibilidad    de formatos</b></font>      <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Con el objetivo    de comprobar el procedimiento propuesto se procede a probarlo en videos con    caracter&iacute;sticas distintas, para esto se utiliza una muestra intencional    no probabil&iacute;stica de videos confeccionada por el autor seleccionando    videos con distintas codificaciones. Se realiza esta prueba para validar la    compatibilidad del procedimiento desarrollado con videos codificados en diferentes    formatos. Entre las caracter&iacute;sticas de estos videos se encuentran el    contenedor, el codificador, el bitrate , los fotogramas por segundo (FPS) y    la resoluci&oacute;n.</font>      <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2">A continuaci&oacute;n    se muestra el resultado de las pruebas de soporte de formato para la ejecuci&oacute;n    del procedimiento con cuatro videos con distintas codificaciones. (Ver <a href="#t01">tablas    1,2,3 y 4</a>)</font>      <P align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><a name="t01"></a><img src="img/revistas/rcci/v8n1/t0104114.png" width="586" height="414"></font>      ]]></body>
<body><![CDATA[<P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Como    se puede apreciar se obtienen resultados satisfactorios para la generaci&oacute;n    de res&uacute;menes con videos con distintas codificaciones, este resultado    evidencia mayor eficacia con respecto al trabajo realizado por (Herranz, 2010)    pues demuestra que el procedimiento desarrollado se puede utilizar en videos    con una codificaci&oacute;n que no se base en los est&aacute;ndares MPEG.</font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Pruebas    de la etapa de an&aacute;lisis</b></font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En    la etapa de an&aacute;lisis se garantiza la obtenci&oacute;n de todos los datos    necesarios para la posterior generaci&oacute;n del resumen, es por este motivo    que se determina validar esta etapa de forma independiente, debido al proceso    de segmentaci&oacute;n que se realiza en la misma, constituye una secci&oacute;n    cr&iacute;tica en el procedimiento propuesto. Las pruebas desarrolladas a continuaci&oacute;n    se realizan con el objetivo de validar la detecci&oacute;n de tomas durante    el an&aacute;lisis utilizando las medidas precission y recall. Para este an&aacute;lisis    se emplea la base de datos de videos creada por Besc&oacute;s. Ver <a href="#t02">Tabla    6</a>.</font>      <P align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><a name="t02"></a><img src="img/revistas/rcci/v8n1/t0204114.png" width="626" height="161"></font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Como    se puede apreciar en la etapa de an&aacute;lisis del procedimiento desarrollado    para la detecci&oacute;n de tomas se garantizan &iacute;ndices de precission    por encima del 90% en todos los casos, lo que se puede considerar aceptado para    estos procedimientos (Mohanta et al., 2010; Davis et al., 2006).</font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Pruebas    de generaci&oacute;n escalable</b></font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">A    continuaci&oacute;n, se muestra la <a href="#t07">tabla 7</a> con los resultados    de las pruebas realizadas al procedimiento propuesto, para la generaci&oacute;n    de varias secuencias sintetizadas del mismo video, teniendo en cuenta la variaci&oacute;n    de la longitud de dichas secuencias. Se establecen varias escalas tanto para    la generaci&oacute;n de storyboard como para la generaci&oacute;n de skiming    de video. Para este an&aacute;lisis se han establecido las siguientes escalas:    20, 30 y 40 cantidad de fotogramas de la secuencia original, para la generaci&oacute;n    de un storyboard y del 10, 20 y 30 por ciento de la secuencia original para    el caso del skiming de video. En la tabla se muestran los tiempos en segundos    que demora el procedimiento para la generaci&oacute;n del resumen para las escalas    establecidas.</font>      <P align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><a name="t07"></a><img src="img/revistas/rcci/v8n1/t0304114.png" width="454" height="322"></font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Igual    que en la etapa de an&aacute;lisis, para las pruebas de generaci&oacute;n escalable    se emple&oacute; la base de datos de videos creada por Besc&oacute;s. Los resultados    evidencian que el procedimiento propuesto brinda la posibilidad de crear res&uacute;menes    de varias escalas, es decir, se obtienen adecuadamente res&uacute;menes con    distintas longitudes y en tiempos de respuesta aceptables. N&oacute;tese que    se duplica la cifra de escalabilidad requerida y no necesariamente se duplica    en correspondencia el tiempo requerido, esto se debe a que la etapa de an&aacute;lisis    para una escala mayor no se ejecuta. A&uacute;n obteni&eacute;ndose estos resultados    no debe descartarse la posibilidad de utilizar otros descriptores visuales que    permitan mejorar la eficacia del procedimiento logr&aacute;ndose resultados    superiores.</font>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Validaci&oacute;n    de usabilidad de los res&uacute;menes</b></font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para garantizar    la usabilidad de un resumen de video, se debe crear un sumario de video que    posea un lenguaje audiovisual que cumpla con dos condiciones esenciales: cobertura    sem&aacute;ntica y agrado visual. La primera de estas condiciones se refiere    a que el resumen creado debe preservar la mayor cantidad de informaci&oacute;n    representativa posible, descart&aacute;ndose la mayor cantidad de informaci&oacute;n    redundante, con el objetivo de minimizar el tiempo requerido para su visualizaci&oacute;n.    La segunda de estas condiciones se refiere a que el resumen no solamente debe    ser informativo, sino que debe poseer caracter&iacute;sticas visuales agradables    para el usuario que finalmente lo visualiza (Truong, et al., 2007; Ren, et al.,    2010).</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para validar la    usabilidad del resumen se ha comprobado la capacidad para suministrar al usuario    una comprensi&oacute;n global de la informaci&oacute;n contenida en el video    original, capacidad para proporcionar una s&iacute;ntesis de la informaci&oacute;n    del video original haciendo prevalecer los contenidos representativos sobre    los verbales y la capacidad para lograr un encadenamiento en mosaico en el que    las tomas o im&aacute;genes que componen, en conjunto el resumen, tengan sentido.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para validar el    cumplimiento de estas dos condiciones se aplic&oacute; una encuesta como instrumento    de diagn&oacute;stico. Se selecciona una t&eacute;cnica de muestreo aleatorio    simple (Bay et al., 2006) considerando una poblaci&oacute;n constituida por    90 usuarios de SIAV. Para determinar el tama&ntilde;o de la muestra se utiliza    el software Stats considerando un nivel de confianza de 95%, estableci&eacute;ndose    aplicar la encuesta a 30 usuarios. La encuesta aplicada consta de cuatro preguntas    en las que el usuario puede asignar un n&uacute;mero real entre 1 y 10 estableciendo    su valoraci&oacute;n sobre la usabilidad del resumen final.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para el an&aacute;lisis    de los resultados se procesa la encuesta promediando los valores obtenidos en    cada una de las preguntas por los 30 usuarios obteni&eacute;ndose los resultados    que se muestran en la siguiente <a href="#t04">tabla</a>.    <br>   </font></p>     <P align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><a name="t04"></a><img src="img/revistas/rcci/v8n1/t0404114.png"></font>      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los    resultados, demuestran que el procedimiento cumple medianamente con las condiciones    de usabilidad establecidas. Se debe continuar refinando el mismo, pues en la    capacidad de brindar cobertura sem&aacute;ntica y agrado visual al usuario final,    los resultados del procedimiento demuestran que a&uacute;n persisten ineficiencias.    Como consecuencia de este resultado se recomienda redefinir la etapa de generaci&oacute;n    del procedimiento propuesto.</font>      <p align="left">&nbsp;</p>     <P align="left">      <P align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El procedimiento    propuesto permite la generaci&oacute;n eficiente de res&uacute;menes escalables    de video, abordando la duraci&oacute;n de las secuencias sintetizadas como requisito    de escalabilidad. Adem&aacute;s, admite la generaci&oacute;n de res&uacute;menes    de videos que no est&aacute;n codificados en est&aacute;ndares MPEG.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las etapas necesarias    para la generaci&oacute;n de un resumen se establecen correctamente, obteni&eacute;ndose    buenos resultados en la etapa de an&aacute;lisis, donde la detecci&oacute;n    de los cambios de tomas muestra &iacute;ndices de precission y recall por encima    del 90% en todos los casos. Adem&aacute;s en esta etapa se garantiza la obtenci&oacute;n    de los datos necesarios para la generaci&oacute;n escalable, sin necesidad de    analizar el video original nuevamente. Por su parte en la etapa de generaci&oacute;n    se logra la obtenci&oacute;n de res&uacute;menes con longitudes distintas, garantizando    la escalabilidad deseada y consigui&eacute;ndose la representaci&oacute;n de    los res&uacute;menes en las modalidades de storyboard y skiming de video.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las principales    dificultades del procedimiento propuesto se evidencian en la capacidad para    lograr adecuadamente cobertura sem&aacute;ntica y agrado visual para el usuario    final, lo que implica la necesidad de redefinir la etapa de generaci&oacute;n    establecida. </font></p>     <p>&nbsp;</p>     <p align="left">      <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>RECOMENDACIONES</b></font>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se recomienda estudiar    la posibilidad de trabajar con otros descriptores visuales lo que puede mejorar    los resultados obtenidos. A pesar de que los resultados demuestran la necesidad    de continuar trabajando en el procedimiento propuesto, se considera que puede    ser utilizado en sistemas de gesti&oacute;n, procesamiento y transmisi&oacute;n    de contenidos audiovisuales, minimizando las limitaciones de estos sistema para    obtener varias secuencias sintetizadas con la informaci&oacute;n significativa    de un mismo video lo que beneficiar&aacute; el proceso de catalogaci&oacute;n    y pre-visualizaci&oacute;n de materiales audiovisuales. </font></p>     <p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B><font size="3">REFERENCIAS    BIBLIOGR&Aacute;FICAS</font></B></font>      <p> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">BAY, H., et al.    SURF: Speeded Up Robust Features. en: Computer Vision - ECCV 2006. LEONARDIS,    A.;BISCHOF, H.et al, Springer Berlin Heidelberg, 2006. 3951: 404-417.p. </font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">BENINI, S., et    al. Extraction of significant video summaries by dendrogram analysis. IEEE Internation    Conference on Image Processing, Atlanta, GA, IEEE, 2006a. 133-136 p. </font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Hierarchical Summarization    of Videos by Tree-Structured Vector Quantization. 2006 IEEE International Conference    on Multimedia and Expo, Toronto, Ont., IEEE. ICME, 2006b. 969 - 972 p. </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">BERKHIN, P. A Survey    of Clustering Data Mining Techniques. en: Grouping Multidimensional Data. KOGAN,    J.;NICHOLAS, C.et al, Springer Berlin Heidelberg, 2006. 25-71.p.     </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">BESC&Oacute;S,    J., et al. A Unified Model for Techniques on Video-Shot Transition Detection    IEEE Transactions on Multimedia, 2005, 7(2).    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">BOULLOSA GARC&Iacute;A,    &Oacute;. Estudio comparativo de descriptores visuales para la detecci&oacute;n    de escenas cuasi-duplicadas. Video Processing and Understanding Lab. Departamento    de Ingenier&iacute;a Inform&aacute;tica. Madrid, Universidad Aut&oacute;noma    de Madrid. Escuela Polit&eacute;cnica Superior, 2011. p.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">CISCO. Cisco Visual    Networking Index: Forecast and Methodology, 2011-2016, 2012.    </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">DAVIS, J., et al.    The relationship between Precision-Recall and ROC curves. Proceedings of the    23rd international conference on Machine learning. Pittsburgh, Pennsylvania,    ACM, 2006. 233-240.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">D&Iacute;AZ BERENGUER,    A., et al. Sistema de gesti&oacute;n y transmisi&oacute;n de contenidos audiovisuales.:    6to Congreso Internacional de Tecnolog&iacute;as, Contenidos Multimedia y Realidad    Virtual. Inform&aacute;tica 2013. La Habana, Cuba, 2013. 5.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">D&Iacute;AZ ESPINOZA,    D. A. Implementaci&oacute;n y comparaci&oacute;n de descriptores para b&uacute;squedas    en video.: Facultad de Ciencias F&iacute;sicas y Matem&aacute;ticas. Departamento    de Ciencias de la Computaci&oacute;n. Santiago de Chile, Universidad de Chile,    2011. p.    </font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">DUMONT, E., et    al. Redundancy removing by adaptive acceleration and event clustering for video    summarization, Klagenfurt University, Austria., 2008. p. 978-0-7695-3130-4/08</font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">GRAMSCI, S. K.    A Scalable Video Streaming Approach using Distributed B-Tree. Computer Science.    Bacouver, The University of British Columbia, 2011.     p.</font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">HERRANZ ARRIBAS,    L. A Scalable Approach to Video Summarization and Adaptation. Escuela Polit&eacute;cnica    Superior de Ingenier&iacute;a Inform&aacute;tica. Madrid, Universidad Aut&oacute;noma    de Madrid. , 2010. 224. p.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">HERRANZ ARRIBAS,    L., et al. A Framework for Scalable Summarization of Video IEEE Transactions    on Circuits and Systems for Video Technology, 2010, 20(9): 1265-1270.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">LIENHART, R. Reliable    Transition Detection in Videos: A Survey and Practitioner's Guide International    Journal of Image and Graphics, 2001, 1(3).    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">L&Oacute;PEZ VIDALES,    N., et al. J&oacute;venes y televisi&oacute;n en 2010 un cambio de h&aacute;bitos.    Revista de estudios de comunicaci&oacute;n, 2011, 30: 97-113.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">MAASS, M., et al.    De memorias y tecnolog&iacute;as radio, televisi&oacute;n e Internet en M&eacute;xico    Estudios sobre las culturas contempor&aacute;neas, 2005, (22): 193-220.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">MITCHELL, J. L.,    et al. MPEG Video Compression Standard. Nueva York, EE.UU., Kluwer Academic,    1996. p. ISBN 0-412-08771-5</font><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">MOHANTA, P. P.,    et al. A heuristic algorithm for video scene detection using shot cluster sequence    analysis. Proceedings of the Seventh Indian Conference on Computer Vision, Graphics    and Image Processing. Chennai, India, ACM, 2010. 464-471.    </font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">OVER, P., et al.    The TRECVid 2008 BBC Rushes Summarization Evaluation, Vancouver, Canada, 2008.    p. 978-1-60558-309-9/08/10</font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">REN, J., et al.    Activity-driven content adaptation for effective video summarization J. Vis.    Commun. Image R, 2010, 21: 930-938.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">TRUONG, B. T.,    et al. Video Abstraction: A Systematic Review and Classification The ACM Transactions    on Multimedia Computing, Communications, and Applications., 2007, 3(1): 37.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">TUYTELAARS, T.,    et al. Local Invariant Feature Detectors: A Survey Foundations and Trends in    Computer Graphics and Vision, 2007, 3(3): 177-280.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">VALD&Eacute;S,    V., et al. On Video Abstraction Systems' Architectures and Modelling. Madrid,    Video Processing and Understanding Lab. Escuela Polit&eacute;cnica Superior,    Universidad Aut&oacute;noma de Madrid, Spain, 2008.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">WAN, T., et al.    A New Technique for Summarizing video sequences through histogram evolution    IEEE, 2010, 6(10).    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">XU, R., et al.    Clustering. Wiley, 2009.    </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">YINZI, C. A Temporal    Video Segmentation and Summary Generation Method Based on Shots' Abrupt and    Gradual Transition Boundary Detecting Second International Conference on Communication    Software and Network, 2010.     p. </font></p>     <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">ZHU, X. Exploring    video content structure for hierarchical summarization Multimedia Systems, 2004,    10: 98-115.    </font> </p>     <P>      ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 13/11/2013    <br>   Aceptado: 17/12/2013</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BAY]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[SURF: Speeded Up Robust Features en Computer Vision - ECCV]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[LEONARDIS]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[BISCHOF]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Springer Berlin Heidelberg]]></source>
<year>2006</year>
<page-range>404-417</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BENINI]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Extraction of significant video summaries by dendrogram analysis.]]></source>
<year>2006</year>
<page-range>133-136</page-range><publisher-loc><![CDATA[Atlanta ]]></publisher-loc>
<publisher-name><![CDATA[IEEE Internation Conference on Image Processing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<collab>IEEE</collab>
<source><![CDATA[ierarchical Summarization of Videos by Tree-Structured Vector Quantization]]></source>
<year>2006</year>
<page-range>969 - 972</page-range><publisher-loc><![CDATA[Toronto ]]></publisher-loc>
<publisher-name><![CDATA[IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BERKHIN]]></surname>
<given-names><![CDATA[P. A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Survey of Clustering Data Mining Techniques en: Grouping Multidimensional Data]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[KOGAN]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[NICHOLAS]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Springer Berlin Heidelberg]]></source>
<year>2006</year>
<page-range>25-71</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BESCÓS]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[A Unified Model for Techniques on Video-Shot Transition Detection IEEE Transactions on Multimedia]]></source>
<year>2005</year>
<volume>7</volume>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BOULLOSA-GARCÍA]]></surname>
<given-names><![CDATA[Ó]]></given-names>
</name>
</person-group>
<source><![CDATA[Estudio comparativo de descriptores visuales para la detección de escenas cuasi-duplicadas.]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Autónoma de Madrid]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<collab>CISCO</collab>
<source><![CDATA[Cisco Visual Networking Index: Forecast and Methodology]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DAVIS]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[The relationship between Precision-Recall and ROC curves.]]></source>
<year>2006</year>
<page-range>233-240</page-range><publisher-loc><![CDATA[Pittsburgh ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DÍAZ-BERENGUER]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Sistema de gestión y transmisión de contenidos audiovisuales: 6to Congreso Internacional de Tecnologías, Contenidos Multimedia y Realidad Virtual]]></source>
<year>2013</year>
<page-range>5</page-range><publisher-loc><![CDATA[La Habana ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DÍAZ-ESPINOZA]]></surname>
<given-names><![CDATA[D. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Implementación y comparación de descriptores para búsquedas en video]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Santiago de Chile ]]></publisher-loc>
<publisher-name><![CDATA[Universidad de Chile]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DUMONT]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Redundancy removing by adaptive acceleration and event clustering for video summarization]]></source>
<year>2008</year>
<page-range>08</page-range><publisher-name><![CDATA[Klagenfurt University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GRAMSCI]]></surname>
<given-names><![CDATA[S. K]]></given-names>
</name>
</person-group>
<source><![CDATA[A Scalable Video Streaming Approach using Distributed B-Tree]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Bacouver ]]></publisher-loc>
<publisher-name><![CDATA[The University of British Columbia]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HERRANZ-ARRIBAS]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[A Scalable Approach to Video Summarization and Adaptation]]></source>
<year>2010</year>
<page-range>224</page-range><publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Autónoma de Madrid]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HERRANZ-ARRIBAS]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[A Framework for Scalable Summarization of Video IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2010</year>
<volume>20</volume>
<page-range>1265-1270</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LIENHART]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Reliable Transition Detection in Videos: A Survey and Practitioner's Guide International Journal of Image and Graphics]]></source>
<year>2001</year>
<volume>1</volume>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LÓPEZ-VIDALES]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Jóvenes y televisión en 2010 un cambio de hábitos.]]></article-title>
<source><![CDATA[Revista de estudios de comunicación]]></source>
<year>2011</year>
<volume>30</volume>
<page-range>97-113</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MAASS]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[De memorias y tecnologías radio, televisión e Internet en México Estudios sobre las culturas contemporáneas]]></source>
<year>2005</year>
<page-range>193-220</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MITCHELL]]></surname>
<given-names><![CDATA[J. L]]></given-names>
</name>
</person-group>
<source><![CDATA[MPEG Video Compression Standard]]></source>
<year>1996</year>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[Kluwer Academic]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MOHANTA]]></surname>
<given-names><![CDATA[P. P]]></given-names>
</name>
</person-group>
<source><![CDATA[A heuristic algorithm for video scene detection using shot cluster sequence analysis]]></source>
<year>2010</year>
<page-range>464-471</page-range><publisher-loc><![CDATA[Chennai ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[OVER]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[The TRECVid 2008 BBC Rushes Summarization Evaluation]]></source>
<year>2008</year>
<publisher-loc><![CDATA[Vancouver ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[REN]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Activity-driven content adaptation for effective video summarization J. Vis. Commun. Image R]]></source>
<year>2010</year>
<volume>21</volume>
<page-range>930-938</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TRUONG]]></surname>
<given-names><![CDATA[B. T]]></given-names>
</name>
</person-group>
<source><![CDATA[Video Abstraction: A Systematic Review and Classification The ACM Transactions on Multimedia Computing, Communications, and Applications]]></source>
<year>2007</year>
<volume>3</volume>
<page-range>37</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TUYTELAARS]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Local Invariant Feature Detectors: A Survey Foundations and Trends in Computer Graphics and Vision]]></source>
<year>2007</year>
<volume>3</volume>
<page-range>177-280</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[VALDÉS]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<source><![CDATA[On Video Abstraction Systems' Architectures and Modelling]]></source>
<year>2008</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Autónoma de Madrid]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WAN]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[A New Technique for Summarizing video sequences through histogram evolution IEEE]]></source>
<year>2010</year>
<volume>6</volume>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[XU]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Clustering]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[YINZI]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[A Temporal Video Segmentation and Summary Generation Method Based on Shots' Abrupt and Gradual Transition Boundary Detecting Second International Conference on Communication Software and Network]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ZHU]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
</person-group>
<source><![CDATA[Exploring video content structure for hierarchical summarization Multimedia Systems]]></source>
<year>2004</year>
<volume>10</volume>
<page-range>98-115</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
