SciELO - Scientific Electronic Library Online

 
vol.12 número2Reparación Compatible en Almacenes de Datos InconsistentesPropuestas para el análisis geoespacial en estudios salubristas. índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista Cubana de Ciencias Informáticas

versión On-line ISSN 2227-1899

Rev cuba cienc informat vol.12 no.2 La Habana abr.-jun. 2018

 

ARTÍCULO ORIGINAL

 

Marca de agua digital basada en DWT-DCT para imágenes de documentos manuscritos: optimización contra ataques de compresión JPEG.

 

DWT-DCT based watermarking for handwritten document images: optimization against JPEG compression attacks.

 

 

Ernesto Avila-Domenech1

1Universidad de Granma. Calle 9 # 419, Rpto. Camilo Cienfuegos, Bayamo, Granma

*Autor para la correspondencia: eadomenech@gmail.com

 

 


RESUMEN

En el presente trabajo se realiza una optimización mediante un Algoritmo Genético de una técnica basada en la combinación de dos exitosas transformadas, la Transformada de Coseno Discreta (DCT) y la Transformada Wavelet Discreta (DWT), específicamente para imágenes correspondientes a documentos manuscritos. La técnica consiste en aplicar la Transformada Wavelet Discreta, dividir una de sus bandas en bloques de 8x8 y aplicarle la Transformada de Coseno Discreta a los bloques seleccionados para insertar información correspondiente a la marca de agua. Luego se modifican algunas de sus componentes según la marca de agua a insertar. La marca de agua consistirá en un código de respuesta rápida (QR Code). Se presentan además los resultados obtenidos en cuanto a la calidad perceptual (PSNR) y de robustez (BER).

Palabras clave:Algoritmo Genético, Documento manuscrito, DWT-DCT, QR Code, Marca de agua digital


ABSTRACT

This paper presents an optimization using a Genetic Algorithm of a technique based on the combination of two successful transforms, the Discrete Cosine Transform (DCT) and Discrete Wavelet Transform (DWT), specifically for handwritten documents images. The technique consists in applying the Wavelet Discrete Transform, dividing one of its bands into 8x8 blocks and applying the Discrete Cosine Transform to the selected blocks to insert information corresponding to the watermark. Then some of its components are modified according to the watermark to be inserted. The watermark will consist of a QR code. In addition, the results obtained in terms of perceptual quality (PSNR) and robustness (BER) are presented.

Key words: genetic algorithm, hadwritten documents, DWT-DCT, QR code, watermarking


 

 

INTRODUCCIÓN

La ciencia Archivística se define como el estudio teórico y práctico de los principios, procedimientos y problemas concernientes a las funciones de los Archivos. Su principal objetivo es lograr que la documentación se mantenga en el tiempo facilitando su consulta.

Los espacios físicos destinados al almacenamiento de los documentos, tomaron diferentes nombres en dependencia de las culturas y de las funciones para las cuales fueron creadas. Dentro de ellos se encuentran los Archivos Históricos, que tienen como finalidad proteger y esparcir por todo el pueblo el patrimonio documental de una nación, región o localidad.

En Cuba, uno de los archivos históricos de mayor relevancia es el Archivo Histórico de Manzanillo (AHM), situado en la provincia Granma. Dicha institución se encuentra en medio de un proceso de informatización y digitalización de sus archivos y documentos históricos, con el objetivo de preservarlos y conservarlos para posteriormente poder difundir, promocionar y socializar la memoria histórica, cultural y documental de la región. Sobre tales objetivos, el AHM ha logrado avances significativos en el desarrollo de soluciones informáticas que responden a los problemas de informatización en la institución. Muestra de ello es la utilización de la aplicación DocLux, desarrollada en la Facultad Regional de la Universidad de las Ciencias Informáticas en Granma (FRG) actualmente perteneciente a la Universidad de Granma. Dicha aplicación permite agilizar el tratamiento a imágenes digitales de archivos históricos, provenientes de múltiples equipos y con diversas características. Además, permite visualizar imágenes digitales, aplicar distintos tipos de filtros (Promedio, Gaussiano y Unshard), obtener mejoras en las imágenes a partir de las técnicas de histograma (brillo, contraste y corrección gamma), cargar varias imágenes para realizarles el proceso de tratamiento, así como almacenarlas en dispositivos externos y en directorios específicos del ordenador.

Una de las características que se le desea adicionar a DocLux es alguna técnica que permita garantizar el derecho de autor de las imágenes tratadas, siendo las marcas de agua digitales el método más utilizado para este fin.

Las marcas de agua digitales son técnicas para el ocultamiento de la información. Es el proceso de insertar un archivo digital en otro. En (Cox, 2008) se definen como la práctica de una imperceptible alteración de un trabajo (imagen, sonido, etc.) para incrustar una información relativa a dicho trabajo.

En varios esquemas de marcas de agua digitales en imágenes, la imagen marcada posee el logo u otra imagen representativa a la organización. Existen dos formas básicas de insertar una marca de agua: en el dominio espacial o en el dominio de la frecuencia, siendo esta última más utilizada pues con ella se garantiza una mayor robustez.

En la literatura se pueden encontrar diferentes técnicas de marcas de agua digitales en el dominio frecuencial, siendo la Transformada de Coseno Discreta (DCT) la más utilizada (Singh and Saxena, 2017; Abraham and Paul, 2016; Nikam and Bujare, 2016; Rahman et al., 2016; Kang et al., 2013). En los últimos años ha sido una tendencia combinar la DCT con la Transformada Wavelet Discreta (DWT), ejemplo de ellos son (Feng et al., 2010; Chow et al., 2017; Ghazvini et al., 2017; Priyanka Rani and Singh, 2016; Salama and Mokhtar, 2016; Jadhao, 2015), por lo que proponer una técnica basada en la combinación DWT-DCT para el marcado digital de imágenes correspondientes a documentos manuscritos resulta una opción tentadora.

En el presente artículo se realiza una optimización mediante un algoritmo genético de una técnica basada en la combinación DWT-DCT específicamente para imágenes de documentos manuscritos. La técnica consiste en aplicar a la imagen original la DWT, dividir una de sus bandas en bloques de 8x8 y aplicarle la DCT a los bloques seleccionados para insertar información correspondiente a la marca de agua. Luego se modifican algunos de sus coeficientes según la marca de agua a insertar. La marca de agua consistirá en un código de respuesta rápida (QR Code) con un texto identificativo al Archivo Histórico.

Transformada de Coseno Discreta

La DCT es una transformada basada en la Transformada de Fourier Discreta (DFT), pero utilizando únicamente números reales. En imágenes, generalmente no se aplica a la imagen de forma directa, sino que primeramente se divide dicha imagen en bloques y luego se aplica la transformada a cada bloque, resultando una matriz dividida en bandas de baja, media y altas frecuencias. Si se posee una imagen de tamaño NxN las ecuaciones utilizadas para calcular la DCT y su inversa (IDCT) son las siguientes:

fo01

donde D representa los coeficientes de la DCT de la imagen y f representa la función obtenida al aplicar la IDCT. Además se define que:

fo02

El primer coeficiente de la matriz obtenida al aplicar la DCT a un bloque (coeficiente DC) es simplemente el promedio de los restantes coeficientes del bloque. Los restantes coeficientes representan sucesivamente de forma creciente las frecuencias.

Transformada Wavelet Discreta

La idea básica de la DWT para señales de una dimensión es dividir la señal en dos partes, altas y bajas frecuencias. Las altas frecuencias representan básicamente los contornos de la señal y las bajas frecuencias se dividen nuevamente en dos partes. Este proceso continúa un número arbitrario de veces. Una de las características de la DWT es que existe la posibilidad de reconstruir la señal original a partir de los coeficientes obtenidos al aplicar la DWT. Este último proceso es llamado Transformada Wavelet Discreta Inversa (IDWT). La DWT y IDWT en dos dimensiones (m,n) pueden ser definidas como la implementación de la DWT y IDWT para una dimensión correspondientes a las dimensiones m y n separadamente. Una imagen puede ser descompuesta en una estructura en pirámide como se muestra en la figura 1.

f01

Se puede apreciar que se obtienen cuatro tipos de coeficientes: aproximación (LL), detalles horizontales (LH), detalles verticales (HL) y detalles diagonales (HH). La aproximación contiene la mayor parte de la energía de la imagen, mientras que los detalles tienen valores próximos a cero.

Códigos de Respuesta Rápida (QR Code)

Los códigos QR contienen información tanto en la dirección vertical como en la horizontal, mientras que un código de barras contiene datos en una sola dirección. Además, tienen mayor volumen de información que un código de barras.

f02

Los códigos QR se desarrollaron en Japón por Denso Corporation en 1994, y más tarde fueron reconocidos como un estándar ISO. Se caracterizan por los tres cuadrados que se encuentran esquinados y que permiten detectar la posición del código al lector. La sigla QR se deriva de la frase inglesa Quick Response (respuesta rápida). No es el único tipo de código de dos dimensiones, pues existen otros tales como PDF 417 (Hahn and Joung, 2002), Data Matrix (Plain-Jones, 1995) y Maxi Code (He et al., 2002).

 

MATERIALES Y MÉTODOS

Los Algoritmos Genéticos son algoritmos de búsqueda heurística inspirados en la evolución natural de poblaciones, en la teoría de la selección natural de Darwin y en la teoría de la transferencia del material genético de Mendel. Estos algoritmos son frecuentemente utilizados para la resolución de problemas complejos de optimización. (Michalewicz and Fogel, 2002)

En los algoritmos genéticos los individuos se denominan cromosomas. Cada cromosoma es una solución a un problema específico. Las características de un cromosoma se denominan genes. También existe una función de aptitud, la cual aplicada a cada cromosoma devuelve un valor que indica cuán apto es y permite compararlos entre ellos. Ver figura 3

f03

Los algoritmos genéticos necesitan para su inicio de una población; una vez que se tiene una población se reproducen los individuos para obtener mayor variedad, tal como en la naturaleza. Luego, es necesario seleccionar los mejores, para ir evolucionando. Hay varios métodos de selección pero en general lo que se busca es que los mejores pasen a la próxima generación y algunos no tan aptos también, ya que la variedad ayuda a que en la reproducción se generen cromosomas más aptos aun que sus padres. Puede que de la cruza de un cromosoma muy apto y otro no tanto resulte uno mucho mejor a sus padres.

En el presente trabajo se propone como función de aptitud (FA) la mostrada en la ecuación 5, donde PSNR es la medición de la imperceptibilidad comúnmente utilizada Relación Señal a Ruido Pico, ber sin ruido representa el número de bits o bloques incorrectamente extraídos de la imagen marcada sin aplicarle ataque alguno con respecto al total de bits o bloques embebidos y ber con ruido lo mismo que ber sin ruido pero correspondiente a la imagen marcada con ruido. β toma valor 0,05 en caso de que ber con ruido < 0,03, de lo contrario toma valor 0.

FA = (PSNR/160 + 1 – ber_sin_ruido + 1 − ber_con_ruido)/3 + β (5)

La FA propuesta tiene como base la media aritmética entre la perceptibilidad y la robustez correspondiente a la imagen marcada sin aplicarle ataque y la imagen marcada atacada con compresión JPEG. Se divide el PSNR entre 160 para lograr un balance de importancia entre la imperceptibilidad y la robustez. Además se adiciona un plus de 0,05 en caso de que ber con ruido < 0,03, esto significa que los errores obtenidos en el proceso están por debajo del límite para lograr una decodificación exitosa del código QR.

Como cromosoma se tomó una cadena de 21 bit, representando la subbanda o tipo de coeficientes de la DWT a seleccionar (2 bit, 4 opciones), el coeficiente inicial y final del subconjunto a modificar (6 bit, 64 opciones cada uno) y el valor a sumar o restar a cada coeficiente en este subconjunto (7 bit, 128 opciones). Ver figura 2

f04

Por ejemplo, si se desea evaluar al cromosoma 110010010110011101010, significa que se debe:

  • seleccionar los coeficientes de detalles diagonales HH cuando se aplica la DWT (α = 3,4ta opción) tomar

  • como coeficiente inicial y final al 9 y 25 respectivamente (coef inicial = 9, coef final = 25)

  • sumar o restar a cada coeficiente en el subconjunto [9, 25], utilizando exploración en zig-zag, el valor 106 (= 106)

Exploración en zig-zag

Los coeficientes de frecuencia más bajos contienen la mayor parte de la energía. En una matriz DCT, a medida que avanza por una fila, la frecuencia aumenta en la primera dimensión y, a medida que avanza por una columna, la frecuencia aumenta en la segunda dimensión. Una frecuencia alta en cualquier dimensión probablemente contenga menos energía. Por ejemplo, el coeficiente ubicado en (2,2) en una matriz DCT de 8x8 generalmente contiene más energía que el coeficiente ubicado en (1,8) en la misma matriz.

Existen dos modos de exploración de los coeficientes transformados con la DCT: “zig-zag” y “zig-zag inverso”. En la presente investigación se utilizó el “zig-zag”, el mismo se representa en 5, donde la esquina superior izquierda es el término DC. Ver figura 5

f05

Técnica de marca de agua digital utilizada

Proceso de embebido

  • Se genera el código QR correspondiente al texto a ocultar.

  • La imagen a marcar es dividida en R, G y B.

  • Se aplica la DWT a la componente B correspondiente al color azul.

  • Se selecciona la subbanda α correspondiente a la DWT dada por el cromosoma a analizar y se divide en bloques de 8x8.

  • Se aplica la DCT a cada uno de los bloques obtenidos.

  • Se le adiciona o substrae un valor a los coeficientes comprendidos entre el coef inicial y el coef final (incluyendo a ambos) en correspondencia con el bit a marcar (1 o 0).

  • Se aplica la IDCT a cada uno de los bloques.

  • Se aplica la IDWT para obtener la componente B modificada.

  • Finalmente se construye una imagen RGB utilizando las componentes R y G de la imagen original y la componente B modificada.

Los valores α, coef inicial, coef _final y son obtenidos por el cromosoma a evaluar.

Proceso de extracción

  • La imagen marcada es dividida en las componentes R, G y B.

  • Se aplica la DWT a la componente B correspondiente al color azul.

  • Se selecciona la subbanda α correspondiente a la DWT y se divide en bloques de 8x8.

  • Se aplica la DCT a cada uno de los bloques obtenidos.

  • Se calcula la sumatoria de los coeficientes comprendidos entre coef inicial y coef final (incluyendo a ambos) y se comprueba si dicha sumatoria es mayor que 0. En caso positivo el bit embebido es 1, de lo contrario el bit embebido es 0.

  • Se genera una imagen con los bit extraídos.

  • Se realiza una simple reconstrucción al código QR y se decodifica con alguna de las aplicaciones existentes.

 

RESULTADOS Y DISCUSIÓN

Para la evaluación de los resultados se utiliza la medición de la imperceptibilidad Relación Señal a Ruido Pico (PSNR) y la medición de robustez (BER) que no es más que el número de bits o bloques incorrectamente extraídos, con respecto al total de bits o bloques embebidos.

El PSNR es calculado mediante la ecuación 6.

fo03

donde MAX denota el máximo valor que puede tomar un pixel y MSE representa el error cuadrático medio.

fo03

donde MxN es el tamaño de la imagen, f(m,n) es la imagen original y f0(m,n) es la imagen marcada.
La imagen marcada no posee diferencia visual cuando el PSNR > 30dB. (Feng et al., 2010) El BER es calculado como lo expresa la ecuación 8.

fo05

donde w(n) y w0(n) son los valores binarios (0 o 1) correspondientes a la marca de agua embebida y la extraída, siendo B el número de pixeles de la marca de agua.

En las pruebas realizadas se tomaron las cuatro imágenes mostradas en la figura 6 como imágenes a marcar y el código QR mostrado en la figura 2 se utilizó como marca de agua digital.

f03

Ver tablas(1, 2, 3, 4)

Los valores obtenidos para cada uno de los ataques expuestos arrojan resultados positivos, pues en el 100% de los casos la marca de agua extraída pudo ser decodificada. Además los valores de PSNR son superiores de 30dB, siendo en la imagen 2.jpg la que mejor resultado se obtuvo, en cuanto a PSNR, al realizar ataque de compresión JPEG con calidad de 25%, 50% y 75%.

En cuanto al BER, es destacable el 0,0 obtenido al extraer la marca de agua a la imagen 1.jpg luego de realizarle un ataque de compresión JPEG con calidad de 25%. Ver figura 7

 

CONCLUSIONES

En el presente trabajo se implementó una técnica de marca de agua digital basada en la combinación DWT- DCT, la cual fue optimizada por un algoritmo genético para imágenes correspondientes a documentos manuscritos. Los resultados muestran un BER inferior a 0,03, por lo que el código QR extraído fue decodificado en el 100% de los casos. Además, los valores de PSNR en la totalidad de los casos superó los 30dB, por lo que no existe diferencia visual para el hombre entre las imágenes originales y las marcadas. También se pudo identificar que la sub-banda LL perteneciente a la DWT es la que mejores resultado brinda para la técnica utilizada en cuanto a ataques de compresión JPEG. Se identificaron los posibles y coeficientes de la DCT a modificar para obtener los mejores resultados según la FA utilizada.

 

REFERENCIAS BIBLIOGRÁFICAS

ABRAHAM, Jobin; PAUL, Varghese. A DCT Based Imperceptible Color Image Watermarking Scheme. International Journal of Signal Processing, Image Processing and Pattern Recognition, 2016, vol. 9, no 7, p. 137–146. doi:http://dx.doi.org/10.14257/ijsip.2016.9.7.13.

CHOW, Yang-Wai; SUSILO, Willy; TONIEN, Joseph; ZONG, Wei. A QR code watermarking approach based on the DWT-DCT technique. Australasian Conference on Information Security and Privacy. Springer, 2017, p. 314–331.

COX, I.J. Watermarking, steganography and content forensics, 2008. ISBN 1605580589.

FENG, Liu Ping; ZHENG, Liang Bin; CAO, Peng. A DWT-DCT Based Blind Watermarking Algorithm for Copyright Protection, 2010.

GHAZVINI, Mahdieh; HACHROOD, Elham Mohamadi; MIRZADI, Mojdeh. An Improved Image Watermarking Method in Frequency Domain. Journal of Applied Security Research, 2017, vol. 12, no 2, p. 260–275. ISSN 1936-1610. doi:10.1080/19361610.2017.1277878. URL http://dx.doi.org/10.1080/19361610.2017. 1277878.

HAHN, Hee Il; JOUNG, Joung Koo. Implementation of algorithm to decode two-dimensional barcode PDF417. Signal Processing, 2002 6th International Conference on, vol. 2. IEEE, 2002. ISBN 0780374886, p. 1791–1794.

HE, Duanfeng; HUNTER, Kevin; JOSEPH, Eugene. Techniques for reading two dimensional code, including maxicode, 2002, .

JADHAO, C.M. Algorithm of QR code based Digital Image Watermarking. International Journal of Combined Research & Development (IJCRD), 2015, p. 4127–4129.

KANG, Qingbo; LI, Ke; YANG, Jichun. A Digital Watermarking Approach Based on DCT Domain Combining QR Code and Chaotic Theory, 2013.

MICHALEWICZ, Z.; FOGEL, D.B. How to Solve It: Modern Heuristics. Springer, New York, 3rd ed., 2002.

NIKAM, Mahesh B; BUJARE, Anil P. DCT based digital image watermarking and de-watermarking for copy right protection. International Conference on Recent Innovations in Engineering and Management, 2016, p. 912–915.

PLAIN-JONES, Charlie. Data matrix identification. Sensor Review, 1995, vol. 15, no 1, p. 12–15. ISSN 0260-2288.

PRIYANKA RANI, Anupam Singh; SINGH, Avinash Kumar. Digital Image Watermarking Using DCT And DWT To Improve Robustness. (IJCSIS) International Journal of Computer Science and Information Security, 2016, vol. 14, no 6, p. 5500.

RAHMAN, Maklachur; AHAMMED, Shale; AHMED, Rishad; IZHAR, Mohammed Navid. A Semi Blind Watermarking Technique for Copyright Protection of Image Based on DCT and SVD Domain. Global Journal of Researches in Engineering, 2016, vol. 16, no 7.

SALAMA, Ahmed S; MOKHTAR, Mohamed Amr. Combined Technique for Improving Digital Image Watermarking. 2nd IEEE International Conference on Computer and Communications, 2016. ISBN 9781467390262, p. 557–562.

SINGH, Mahima; SAXENA, Ankur. Image watermarking using discrete cosine transform [DCT] and genetic algorithm [GA]. International Journal of Innovation in Engineering Research & Management, 2017, vol. 04, no 03, p. 1–13.

 

 

Recibido: 20/09/2017
Aceptado: 05/04/2018

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons