6.1.08

Búsqueda en imágenes por el contenido: imgSeek

Estoy preparando un artículo para Linux+ sobre el software imgSeek, que es de los pocos que son libres, robustos y permiten una búsqueda de imágenes por el contenido. Es decir, que no utiliza ni metadatos agregados manualmente por expertos (etiquetas que describen la temática o los contenidos de la imagen), ni el texto que rodea a una imagen cuando está dentro de un documento multimedia (como las páginas HTML, que es lo que hace Google a grandes rasgos).

imgSeek usa realmente el contenido, es decir, compara imágenes a través de una representación basada en los propios píxeles de las mismas, adecuadamente procesados usando básicamente una trasformación wavelet de Van Haar, según se describe de manera más técnica en este trabajo de Jacobs et al.:

Charles E. Jacobs, Adam Finkelstein, and David H. Salesin. Fast Multiresolution Image Querying. Proceedings of SIGGRAPH 95. pp. 277-286, August 1995. [Presentación más accesible]

Se puede buscar imágenes similares a una dada o a un esbozo. El autor, Ricardo Cabral, ha desarrollado una demostración Web (Flickr Suggestions) sobre las fotos de Flickr, que sólo permite búsqueda por similitud a una imagen. Aconsejo descargar y jugar un poco con imgSeek, pero antes se puede uno hacer una idea de como funciona usando otro software Web que utiliza los mismos algoritmos, llamado Retrievr.

¿Cómo usar esto para detectar pornografía y juegos de casino? Yo ya tengo dos ideas...

Powered by Zoundry

4 comentarios:

JoSeK dijo...

Muy interesante. De hecho me parecería muy útil hacer un proceso "a la inversa con este software". Es decir, tener una biblioteca de etiquetas estándar cada una de ellas asociadas a una serie de imágenes. Con esto, para una imagen dada, se comprobaría el parecido con las imágenes de cada etiqueta, para todas las etiquetas.

El resultado es un etiquetado automático de fotografías o imágenes que puede ser muy útil para hacer búsquedas por palabras clave o para dar semántica a las imágenes si nos apoyamos en una ontología.

Que decir que algunas etiquetas pueden tener relación con pornografía, casinos, etc. lo cuál le da una segunda utilidad ;)

JoSeK dijo...

Esta entrada del blog y la aparición de PanImage me han inspirado para escribir una entradilla en el mio: http://josekblog.blogspot.com/2008/01/recuperacin-de-imgenes.html

Luis Diaz del Dedo dijo...

Curioso! Buscando info para mi TMF sobre ImgSeek me encontré de nuevo con Nihil Obstat! Saludos!

Jose Maria Gomez Hidalgo dijo...

Eso es que estas usando el algoritmo "random walk" :-)