Performance des systèmes de vision dans le cadre de la détection d'obstacles routiers
Abstract
One approach that is being explored to improve driving safety is to develop aids which forecast risky situations. Selection of the most appropriate sensor or sensors to perceive the environment is a crucial stage in the development of such aids. Amongst other things, the selection process must consider the operating domain and performance of each sensor. However, while the accuracy of telemetric sensors is well known, that of vision sensors is incompletely described in the literature. This paper attempts to fill this gap by quantifying the accuracy with which the position of an object detected by vision is identified. After a brief description of the equations which describe the projection of the points in the scene in the image, the reverse problem, that of retroprojection, is examined. As the surface area of a pixel is not zero, the positioning obtained by triangulation is necessarily imprecise. We therefore propose a statistical method to estimate the average position of the perceived point and the error associated with this position. The positioning error is assessed by conducting a set of simulations in which the longitudinal and lateral position of the point to be detected is varied, along with the number of images considered, the error in the image position detection image and the size of the pixels. The theoretically achievable performance for monoscopic and stereoscopic vision are compared and the differences between them are explained. Finally, a theoretical study is validated by a comparison with results obtained in real situations.
Résumé
Une des voies envisagées pour améliorer la sécurité de la conduite est la réalisation d'aides ayant la capacité d'anticiper sur d'éventuelles situations à risques. Le choix du (ou des) capteur(s) qu'il convient d'utiliser pour percevoir l'environnement est une étape cruciale dans la réalisation de telles aides. La sélection doit, entre autres, prendre en compte le domaine de fonctionnement de chaque capteur et leurs performances respectives. Or, si les performances en termes de précision des capteurs télémétriques sont bien identifiées, celles des capteurs de vision ne sont que partiellement décrites dans la littérature. L'article s'attache à combler cette lacune en quantifiant la précision de positionnement de l'objet détecté par vision. Après une brève description des équations modélisant la projection des points de la scène dans l'image, le problème inverse, ou rétroprojection, est posé. Le pixel ayant une surface non nulle, la localisation obtenue par triangulation est forcément imprécise. Une méthode statistique est alors proposée pour estimer la position moyenne du point perçu, ainsi que l'erreur commise sur ce positionnement. Un ensemble de simulations permet d'évaluer l'erreur de positionnement en faisant varier la position longitudinale et latérale du point à détecter, le nombre d'images considérées, l'erreur sur la position image de la détection et la taille des pixels. Les performances théoriques accessibles en monovision et en stéréovision sont confrontées et les écarts expliqués. Une comparaison avec des résultats obtenus en situation réelle valide finalement notre étude théorique.
Reference
@ARTICLE{jpt-rts04,
author = {Glaser, S. and Aubert, D. and Tarel, J.-P.},
title = {Performance des syst\`emes de vision dans le cadre de la d\'etection d'obstacles routiers},
journal = {Recherche Transport S\'ecurit\'e},
volume = {21},
number = {84},
pages = {155-170},
year = {2004},
url = {http://perso.lcpc.fr/tarel.jean-philippe/publis/rts04.html}
}
Pdf file (388 Kb)
(c) Lavoisier