xeral[arroba]galinus.com

Artículos de Galinus >

Metadatos en los sistemas de navegación

Resumen: En este trabajo exponemos el caso particular de recuperación de la información, alternativo a las carpetas o directorios, con un ejemplo de navegador que utiliza un conjunto reducido de metadatos.

Una vez visto a fondo el proceso de navegación, dejamos abiertas la posibilidad de ampliarlo y emplearlo en otros contextos.

Introducción

A medida que aumenta la cantidad de información con la que trabajamos en nuestros ordenadores, surge la necesidad de un medio más adecuado con las carpetas o directorios para tenerla clasificada y poder recuperarla rápidamente.

Una posible solución son interfaces gráficas que utilizan datos que caracterizan a los ficheros (metadatos) para crear sistemas de información más eficaces con las carpetas.

Definición de metadatos

Metadato: dato que da información sobre alguna característica de un fichero.

Escogemos una definición de metadatos sencilla, relativa a documentos de todo tipo (texto, imágenes, vídeo, etc) con los que trabajamos a diario en nuestros ordenadores. No entramos en matices o definiciones más precisas porque no son relevantes para el tema que tratamos. En la bibliografía podeis encontrar enlaces a sitios con definiciones de metadatos más completas.

No existe un conjunto único de metadatos para un fichero. Se escogen los más adecuados para cada situación. Nombre, fecha de creación, tipo de fichero y tamaño son algunos de los metadatos a los que estamos más acostumbrados cuando trabajamos en Linux, Mac OS X; o Windows. Otros como autor o lugar de creación serían perfectamente válidos. Para conocer más a fondo un sistema operativo con un conjunto de metadatos muy completo, visitad una web dedicada al Be OS.

Directorios, un metadato más

Pensemos en el directorio en el que está guardado un documento llamado morteruelo.pdf

C:\Documentos\Cocina\

Aunque estemos acostumbrados a visualizarlo como carpetas, no es difícil ver que se trata simplemente de una etiqueta que nos dice donde está guardado el fichero en el disco duro. Es, por lo tanto, un metadato ya que da una característica del fichero: su ubicación.

Veamos un conjunto de metadatos para este fichero en el siguiente esquema.

nombre spaguetti.pdf
ruta C:\Documentos\Cocina\
tamaño 150 kb
fecha de creación 21/5/03 8:30 am
fecha de última modificación 22/5/03 2:15 pm

Podemos echar un vistazo a estos datos seleccionando un archivo y escoger el menú "Archivo->Obtener información" en el Mac OS, o con menú emergente, en la opción "Propiedades" en Windows.

Estos son algunos de los metadatos más utilizados y describirían el conjunto de bytes que forman el PDF propiamente dicho (nuestra receta de morteruelo). Lo que hacemos cuando nos referimos a él es, de hecho, utilizar los metadatos "ruta" y "nombre", estando el primero representado por una serie de carpetas y subcarpetas que hacen la identificación visual de un modo más natural. Por lo tanto, el sistema de carpetas no es más que un navegador que utiliza estos dos metadatos: vamos explorando distintas ubicaciones o rutas (carpetas) hasta encontrar el fichero deseado identificándolo por el nombre.

En seguida vemos que hai muchos metadatos que no se utilizan. ¿Sería posible diseñar un sistema que utilizase el resto de los metadatos como ayuda a la navegación? ¿tendría esto alguna ventaja?

Ya mencionamos el sistema operativo BeOS, en el que, probablemente, se basen las próximas evoluciones de Mac OS X y Windows. Pero hay muchas situaciones en las que un enfoque de este tipo, puede ayudarnos a solucionar problemas concretos. En el siguiente ejemplo veremos un programa que utiliza 4 metadatos y en el que es posible basar una interfaz para aplicar en la web.

Navegadores por metadatos

El iTunes es un organizador de MP3, AAC y otros formatos de son, que utiliza un navegador de 3 metadatos (más el nombre del fichero) para encontrar las canciones almacenadas en nuestro disco duro. Lo podeis descargar en la página de Apple

¿Como funciona este navegador?

Cuando insertamos un CD de audio en nuestro ordenador, el programa arranca e intenta conectarse a internet para identificar el disco y recoger los datos de las canciones: título, autor, estilo y álbum (si el CD contiene AAC o MP3 es muy probable que ya vengan estos datos junto a cada fichero). Una vez hecho esto, las podemos importar a nuestro disco duro donde quedarán perfectamente etiquetadas.

Una vez recogidos estos datos, quedan asociados a cada fichero de sonido y son utilizados por el navegador para encontrar canciones o grupos de ellas sin necesidad de saber en que carpeta están guardadas.

Nota: el programa crea automáticamente una carpeta cada vez que se importa música. Aunque están muy bien organizadas (fig 4), el navegador incorporado al programa tienen tantas ventajas que rara vez se recurre a aquelas.

En la primera imagen se puede ver el aspecto de la interfaz del programa. Lo que nos interesa es el navegador de la parte superior y el listado de canciones que hay debajo.

Vista general de la interfaz de iTunes
Vista general de la interfaz de iTunes



En la esquina superior derecha hay un botón que muestra o oculta el navegador.

Haciendo clic en un elemento de cualquiera de las 3 columnas, el programa filtrará la lista de canciones para presentar sólo aquellas a las que le corresponda ese dato. Como las canciones llevan también asociados otros 2 metadatos, a las 2 columnas restantes se actualizan para mostrar sólo los correspondientes a las canciones filtradas por la primera columna.

Veamos un ejemplo:

Escogemos el estilo "África subsahariana" en la columna "género". En la lista de canciones aparecen automaticamente todas aquellas de ese estilo y en la columna artista únicamente aquellos que tengan alguna canción africana, lo mismo que en la columna "álbum", con un listado de los que contengan alguna canción de ese estilo.

 

Detalle de la interfaz do Itunes
Vista general de la interfaz de iTunes



Ahora haciendo clic en alguno de los elementos de la lista "artista", en la columna "álbum" aparecen los discos del artista seleccionado que contengan alguna canción del estilo "África subsahariana".

Detalle da interfaz do Itunes
Vista general de la interfaz de iTunes

En la lista de canciones siempre aparecen las que cumplen todas las condiciones.

Por otro lado, también es posible escoger varios datos simultáneamente (por ejemplo, "Jazz, Fusión y Acid" y "Jazz, New cool") en cada una de las columnas

Con este sistema podemos comenzar la búsqueda por el criterio que deseemos (álbum, estilo o artista) e irla refinando hasta llegar al conjunto de canciones buscadas. La gran diferencia con un navegador de directorios es que aquí hay multitud de caminos para llegar al resultado deseado.

Para verlo más claro, podemos echarle un vistazo a la estructura de carpetas que utiliza este programa. aunque se generan de un modo automático, es una organización bastante "humana".

Estructura de arquivos que utiliza o iTunes
Estructura de carpetas del programa

Para encontrar canciones tenemos que conocer a la fuerza el autor y buscarlo en una lista que suele ser bastante grande (alrededor de 1000 canciones y 125 artistas en este caso). No podemos utilizar el dato "estilo" ni tampoco el álbum hasta que hayamos encontrado la carpeta correcta.

Aunque que se organicen de otro modo, siempre habrá el mismo problema: sólo existe un camino correcto para cada búsqueda.

El problema es aún mayor cuando buscamos grupos de canciones con una característica común. Con este sistema ¿como hacemos una colección de todas las canciones brasileñas de nuestra discoteca? ¿y de todas las que contengan la palabra "África"?

Conclusiones

En el caso de iTunes, la navegación por metadatos muestra toda su potencia. Ahora bien, ésta es una situación muy concreta en la que es posible definir un conjunto de metadatos muy útiles para etiquetar la información y basar un sistema de navegación en ellos.

Bajo las seguintes condiciones podremos diseñar un navegador de este tipo

1) Que la mayor parte de los datos pueda ser recopilado de un modo automático. Pensemos en un sistema en el que cada vez que se guarda un documento, tengamos que introducir 4 o 5 datos. Únicamente lo harían los usuarios más motivados y así la calidad de los metadatos suele ser mala.

Esta condición no es indispensable. De hecho, hoy en día se está estudiando el coste de catalogación manual en grandes intranets y su beneficio. Para ampliar este tema, consulta la bibliografía.

2) Que el número de metadatos necesario sea lo suficientemente pequeno (menos de 6).

3) Que los metadatos contengan propiedades (valores de los metadatos) comunes. Si escogemos algún metadato tal que su valor sea único para cada fichero, no nos va a servir para el sistema de navegación. La razón es sencilla: la lista de posible valores es una relación uno a uno (un fichero, un valor de metadato) lo que es equivalente a buscar por el nombre entre todos los ficheros existentes, cosa que queremos evitar.

En el próximo artículo veremos un ejemplo para la web.

Enlaces

Ver más artículos

Licencia de Creative Commons

Artículo bajo licencia de Creative Commons.


En Galinus somos profesionales de la comunicación en internet.

Si quieres aprovechar al máximo las posibilidades de las tecnologías de la comunicación, contacta con nosotros.