viernes, noviembre 07, 2008

Metadatos e Información Oculta en documentos de OpenOffice (I de VI)
por Enrique Rando y Chema Alonso

***************************************************************************************
Artículo publicado en PCWORLD Octubre de 2008
- Metadatos e Información Oculta en documentos de OpenOffice (I de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (II de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (III de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (IV de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (V de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (VI de VI)
***************************************************************************************

Internet está cambiando. Tras la revolución que supuso la Web 2.0 y las redes sociales, los expertos investigan ya nuevos paradigmas. Uno de ellos es la Web Semántica: una nueva red en la que, idealmente, las aplicaciones podrán interactuar sin intervención humana, porque conocerán el significado de los datos y las relaciones existentes entre ellos. Para ello es necesario que la información esté autodocumentada.

Metadatos

La Web Semántica se basa en el uso y normalización de METADATOS. Los metadatos son datos relativos a documentos y recursos publicados, tales como el autor, el tema o la fecha de creación. Esta información se incorpora a los propios documentos, facilitando nuevos criterios para las búsquedas y el establecimiento de vínculos entre recursos.

Es de esperar que, en un futuro próximo, las organizaciones incluyan más y más metadatos en sus documentos. Los metadatos ya están entre nosotros y su intención es quedarse. Para lo bueno y para lo malo. Sin embargo, el uso de metadatos se remonta tiempo atrás y muchas aplicaciones incluyen metadatos en los ficheros que generan para ayudar a comprender mejor la información que contienen y facilitar su posterior procesamiento automático.

OpenOffice

La conocida suite ofimática OpenOffice no podía quedar al margen de esta tendencia. Ya en su primera versión incorporaba metadatos descriptivos de los documentos y, para la próxima versión 3, disponible ya en beta, se había anunciado un tratamiento mejorado de éstos.

Pero cada funcionalidad tiene una contrapartida. Hoy en día muchas organizaciones no gestionan apropiadamente los metadatos de los documentos que publican, y eso puede perjudicar su imagen pública y poner en riesgo la seguridad de sus sistemas de información. ¿Cómo?

Formato de archivo ODF

OpenOffice 2 utiliza de forma nativa el formato ODF (OpenDocument Format), un formato estándar y abierto definido por OASIS y aprobado por ISO. En ODF, los documentos se almacenan como un archivo comprimido ZIP que contiene un conjunto de ficheros en formato XML con el contenido del documento.

Así, si utilizamos utilizamos un programa de compresión para abrir un documento ODT (fichero de texto creado con OpenOffice Writer) nos encontramos, entre otros, con los siguientes archivos:

- meta.xml: Contiene metadatos relativos al documento y, como se indica en la ayuda del producto, este fichero no se cifra ni siquiera cuando el documento esté protegido mediante contraseña.

- settings.xml: Incluye información relativa a la configuración y a los ajustes del documento.

- content.xml: En este fichero se almacena el contenido principal, es decir, el texto del documento.


Figura 1: Contenido de un documento ODT

Aunque la versión de OpenOffice 1 utiliza extensiones de archivo distintas a las de OpenOffice 2, los documentos son guardados de forma similar. No hay que olvidar que ODF se construyó como una evolución de los formatos de fichero utilizados en OpenOffice 1.

Datos Personales

Los primeros metadatos que genera un usuario utilizando OpenOffice se crean durante la instalación del software y la primera vez que se ejecuta. La suite solicita al usuario una serie de datos que, por defecto van a acompañar a los documentos creados con esa versión del software.


Figura 2: Datos de usuario durante el proceso de Instalación



Figura 3: Datos de usuario solicitados la primera vez que se usa el paquete de software

OpenOffice va a almacenar esta información de forma que pueda acompañar, como una firma, a los documentos generados desde ese software. No obstante, todos estos datos, y más información, pueden ser modificados y ampliados posteriormente en OpenOffice, utilizando el cuadro de Opciones del menú Herramientas como se puede ver en la Figura 4.


Figura 4: Modificación de datos de usuario

Parte de esta información se va a almacenar en los documentos generados con OpenOffice. De esta forma, si creamos un nuevo documento de texto y comprobamos el contenido del fichero meta.xml que se ha generado, encontraremos la siguiente información:


Figura 5: Fichero meta.xml

De los datos personales sólo se aprecia el nombre y los apellidos. Quizá estemos interesados en que esa información aparezca ahí o quizá no. Un usuario o una empresa debería decidirse al respecto antes de publicar este documento en Internet, enviarlo por correo electrónico, o a hacerlo público por cualquier otro método. Como se puede apreciar en la Figura 5, también se encuentra información relativa a la versión de OpenOffice y al sistema operativo que se está utilizando. ¿Realmente interesa que esa información sea conocida cuando se publica un documento?

***************************************************************************************
Artículo publicado en PCWORLD Octubre de 2008
- Metadatos e Información Oculta en documentos de OpenOffice (I de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (II de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (III de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (IV de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (V de VI)
- Metadatos e Información Oculta en documentos de OpenOffice (VI de VI)
***************************************************************************************

2 comentarios:

Anónimo dijo...

Hola chema... oye conoces esta herramienta?
http://sourceforge.net/projects/injectiondenied/

Que te parece??

Gracias!

Xtrelan dijo...

Buenos días Chema,

seria posible que contactaras a esta cuenta para enviarte una propuesta para un evento? bueno es un id de google así que ahí puedes enviar un contacto para devolverte la presentación a un correo válido, sino la "detallo" aquí: xtrelan en en correog punto com

saludos

Entrada destacada

Programa de Especialización "Inteligencia Artificial para Expertos en Ciberseguridad" 2ª Edición.

Hoy, en medio del verano, os traigo información de la 2ª Edición del   Programa de Especialización  de "Inteligencia Artificial para Ex...

Entradas populares