Actualmente, las búsquedas y clasificaciones en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual que contienen Esta técnica pionera, desarrollada en la UGR, permite clasificar fotos o imágenes según aparezcan o no personas en ellas, o algún tipo objeto concreto.
Investigadores de la Universidad de Granada han desarrollado una nueva técnica informática que permite «enseñar» al ordenador a interpretar el contenido visual de una imagen en movimiento o una fotografía. Este avance permitiría, por ejemplo, clasificar de forma automática fotografías según aparezcan o no personas en ellas, o algún tipo de objeto concreto, así como clasificar escenas de vídeo donde aparecen personas con una pose determinada.
En la actualidad, las búsquedas y clasificaciones de fotografías en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual contenida en ellas. El trabajo realizado en la Universidad de Granada permite utilizar este parámetro y, a corto plazo, hará que estas técnicas se puedan usar para clasificar escenas de vídeo según la acción que realizan en ellas las personas.
La investigación ha sido llevada a cabo por Manuel Jesús Marín Jiménez, que actualmente trabaja en la Universidad de Córdoba, y dirigida por el profesor Nicolás Pérez de la Blanca Capilla, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.
Una pose concreta
Además de detectar cuándo aparecen personas en fotogramas de vídeos o películas de TV, estas nuevas técnicas permiten estimar la posición de sus miembros superiores (cabeza, torso, brazos y antebrazos), así como llevar a cabo una clasificación automática de escenas de vídeo donde aparecen personas con una pose concreta, y reconocer acciones humanas en secuencias de vídeo, tales como caminar, saltar, agacharse…
Como explica Marín Jiménez, en la actualidad existe, a nivel mundial, un gran interés, por parte de multitud de compañías potentes ,como Microsoft o Google, en conseguir que los computadores sean capaces de interpretar de forma automática el contenido visual de las imágenes y vídeo. «Nuestro trabajo –afirma el investigador- presenta pequeñas aportaciones para avanzar en ese ambicioso problema».
Los resultados de esta investigación han sido presentados en congresos internacionales, como el International Conference in Pattern Recognition (ICPR) en 2006, o el Computer Vision and Pattern Recognition (CVPR) en 2008 y 2009. Parte de dichos trabajos han sido desarrollados en colaboración con investigadores de la University of Oxford y el ETH de Zurich.
Más información:
Manuel Jesús Marín Jiménez.
Departamento de Informática y Análisis Numérico de la Universidad de Córdoba.
Teléfono: 957 212 172 – 958 243 301.
Correo electrónico: mjmarin@uco.es