Actuellement, les recherches et les classifications en PCs se réalisent d’après le nom du fichier, le dossier ou des attributs tels que la date ou le format, mais n’utilisent pas l’information visuelle qu’ils contiennent. Cette technique pionnière, développée à l’UGR, permet de classifier des photos ou des images selon que des personnes ou des objets concrets y apparaissent ou pas
Des chercheurs de l’Université de Grenade ont développé une nouvelle technique informatique qui permet d’enseigner à l’ordinateur à interpréter le contenu visuel d’une image en mouvement ou d’une photographie. Cette avancée permettra, par exemple, ce classifier automatiquement des photographies selon que des personnes ou des objets concrets y apparaissent ou pas, ou de classifier des scènes de vidéo où apparaissent des personnes dans une pose déterminée.
Actuellement, les recherches et classifications de photographies en PCs se réalisent selon le nom du fichier, le dossier ou des attributs tels que la date ou le format, mais n’utilisent pas l’information visuelle qu’ils contiennent. Ce travail réalisé à l’UGR permet d’utiliser ce paramètre et fera, à court terme, que ces techniques permettent de classifier des photos ou des images selon que des personnes ou des objets concrets y apparaissent ou pas.
La recherche a été menée à bien par M. Manuel Jesús Marín Jiménez, qui travaille actuellement à l’Université de Cordoue, et dirigée par le professeur Nicolás Pérez de la Blanca Capilla, du Département de Sciences de la Computation et de l’Intelligence Artificielle de l’Université de Grenade.
Une pose concrète
Outre la détection du moment de l’apparition des personnes dans des photogrammes de vidéos ou de films de TV, ces nouvelles techniques permettent d’estimer la position des membres supérieurs (tête, torse, bras et avant-bras), de mener à bien une classification automatique de scènes de vidéo où apparaissent des personnes dans une pose concrète, et de reconnaître des actions humaines dans des séquences de vidéo, comme marcher, sauter, se baisser…
Tel que l’explique M. Marín Jiménez, il existe actuellement au niveau mondial un grand intérêt, de la part de nombre de compagnies importantes comme Microsoft ou Google, pour que les ordinateurs soient capables d’interpréter de façon automatique le contenu visuel des images et des vidéos. « Notre travail ―affirme le chercheur― présente de petits apports afin d’avancer dans cet ambitieux projet. »
Les résultats de cette recherche ont été présentés dans d’importants congrès internationaux, comme l’International Conference in Pattern Recognition (ICPR) en 2006, ou le Computer Vision and Pattern Recognition (CVPR) en 2008 et 2009. Une partie de ces travaux ont été développés avec la collaboration de chercheurs de l’Université d’Oxford et l’ETH de Zurich.
Illustrations
– Détection de personnes par TV : http://www.robots.ox.ac.uk/~vgg/software/UpperBody/index.html
– Estimation et reconnaissance de poses humaines : http://www.robots.ox.ac.uk/~vgg/research/pose_estimation/index.html
Note : Les images de ces travaux ont été réalisées avec la collaboration de l’Université d’Oxford et l’ETH de Zurich.
Contact : Manuel Jesús Marín Jiménez. Département d’Informatique et d’Analyse Numérique de l’Université de Cordoue. Tél. : +34 957 212172. 958 243 301 ; courriel : mjmarin@uco.es