Difference between revisions of "WISS"

From IntRoLab
Line 9: Line 9:
 
= DESCRIPTION =  
 
= DESCRIPTION =  
  
 +
<english>
 +
Artificial audition recently became popular in mobile robotics in order to enhance the human-robot interaction. Speech recognition is the main field of interest whereas speaker recognition receives little attention. The ManyEars system (based on the [[AUDIBLE]] project allows a mobile robot to localize, track and separate multiple simultaneous sound sources. This system uses an array of eight microphones disposed in a cubic shape. This speaker recognition system, named WISS (Who IS Speaking), is coupled to the ManyEars system. This speaker recognition system is robust to noise and dynamic environments. Parallel model combination (PMC) and masks are used to increase the identification rate within a noisy environment. A confidence value is also introduced to weight the obtained identifications. The simplicity of this system makes it suitable for real-time applications on a General Purpose Processor (GPP).
 +
</english>
 
<french>
 
<french>
L'audition artificielle est de plus en plus utilisée en robotique mobile pour améliorer l'interaction humain-robot. La reconnaissance de la parole occupe présentement une place importante tandis que la reconnaissance de locuteurs est encore peu explorée pour ce genre d'application. Le système ManyEars permet actuellement à un robot mobile de localiser, suivre et séparer plusieurs sources sonores. Ce système utilise un ensemble de huit microphones qui sont disposés en cube. Ce système de reconnaissance de locuteurs, nommé WISS (Who IS Speaking ), est couplé au système ManyEars (qui découle du projet [[AUDIBLE]]). Le système de reconnaissance de locuteurs conçu est robuste au bruit ambiant et au changement d'environnement. Une technique de parallel model combination (PMC) et des masques sont utilisés pour améliorer le taux d'identification dans un milieu bruité. Un indice de confiance est également introduit pour pondérer les identifications obtenues. La simplicité du système proposé fait en sorte qu'il est possible d'exécuter en temps réel l'algorithme sur un General Purpose Processor (GPP).
+
L'audition artificielle est de plus en plus utilisée en robotique mobile pour améliorer l'interaction humain-robot. La reconnaissance de la parole occupe présentement une place importante tandis que la reconnaissance de locuteurs est encore peu explorée pour ce genre d'application. Le système ManyEars (qui découle du projet [[AUDIBLE]]) permet actuellement à un robot mobile de localiser, suivre et séparer plusieurs sources sonores. Ce système utilise un ensemble de huit microphones qui sont disposés en cube. Ce système de reconnaissance de locuteurs, nommé WISS (Who IS Speaking ), est couplé au système ManyEars. Le système de reconnaissance de locuteurs conçu est robuste au bruit ambiant et au changement d'environnement. Une technique de parallel model combination (PMC) et des masques sont utilisés pour améliorer le taux d'identification dans un milieu bruité. Un indice de confiance est également introduit pour pondérer les identifications obtenues. La simplicité du système proposé fait en sorte qu'il est possible d'exécuter en temps réel l'algorithme sur un General Purpose Processor (GPP).
 
</french>
 
</french>
  

Revision as of 20:43, 24 October 2011

Will display text in english.


DESCRIPTION

Artificial audition recently became popular in mobile robotics in order to enhance the human-robot interaction. Speech recognition is the main field of interest whereas speaker recognition receives little attention. The ManyEars system (based on the AUDIBLE project allows a mobile robot to localize, track and separate multiple simultaneous sound sources. This system uses an array of eight microphones disposed in a cubic shape. This speaker recognition system, named WISS (Who IS Speaking), is coupled to the ManyEars system. This speaker recognition system is robust to noise and dynamic environments. Parallel model combination (PMC) and masks are used to increase the identification rate within a noisy environment. A confidence value is also introduced to weight the obtained identifications. The simplicity of this system makes it suitable for real-time applications on a General Purpose Processor (GPP).


AUTHORS[edit]


VIDÉOS