Difference between revisions of "WISS"

From IntRoLab
(Description)
 
(25 intermediate revisions by 4 users not shown)
Line 1: Line 1:
 +
<analytics uacct="UA-27707792-1" ></analytics>
 +
= Description =
 +
 
<english>
 
<english>
Will display text in english.
+
Artificial audition recently became popular in mobile robotics in order to enhance the human-robot interaction. Speech recognition is the main field of interest whereas speaker recognition receives little attention. The ManyEars system (based on the [[AUDIBLE]] project) allows a mobile robot to localize, track and separate multiple simultaneous sound sources. This system uses an array of eight microphones disposed in a cubic shape. This speaker recognition system, named WISS (Who IS Speaking), is coupled to the ManyEars system. This speaker recognition system is robust to noise and dynamic environments. Parallel model combination (PMC) and masks are used to increase the identification rate within a noisy environment. A confidence value is also introduced to weight the obtained identifications. The simplicity of this system makes it suitable for real-time applications on a General Purpose Processor (GPP).
 
</english>
 
</english>
 
 
<french>
 
<french>
Texte en français.
+
L'audition artificielle est de plus en plus utilisée en robotique mobile pour améliorer l'interaction humain-robot. La reconnaissance de la parole occupe présentement une place importante tandis que la reconnaissance de locuteurs est encore peu explorée pour ce genre d'application. Le système ManyEars  (qui découle du projet [[AUDIBLE]]) permet actuellement à un robot mobile de localiser, suivre et séparer plusieurs sources sonores. Ce système utilise un ensemble de huit microphones qui sont disposés en cube. Ce système de reconnaissance de locuteurs, nommé WISS (Who IS Speaking ), est couplé au système ManyEars. Le système de reconnaissance de locuteurs conçu est robuste au bruit ambiant et au changement d'environnement. Une technique de parallel model combination (PMC) et des masques sont utilisés pour améliorer le taux d'identification dans un milieu bruité. Un indice de confiance est également introduit pour pondérer les identifications obtenues. La simplicité du système proposé fait en sorte qu'il est possible d'exécuter en temps réel l'algorithme sur un General Purpose Processor (GPP).
 
</french>
 
</french>
  
= DESCRIPTION =
+
<div style="text-align: center;">
 +
[[File:ManyEars_Overview_v2.png]]
 +
 
 +
<english>'''Fig. 1'''. Blocks diagram of the ManyEars system</english>
 +
<french>'''Fig. 1'''. Schéma-bloc du système ManyEars</french>
 +
</div>
 +
 
  
 +
 +
 +
 +
<div style="text-align: center;">
 +
[[File:Wiss_entrainement_v4.png]]
 +
 +
<english>'''Fig. 2'''. Blocks diagram of the WISS system for training</english>
 +
<french>'''Fig. 2'''. Schéma-bloc du système WISS pour l'entraînement</french>
 +
</div>
 +
 +
 +
 +
 +
 +
<div style="text-align: center;">
 +
[[File:Wiss_evaluation_v3.png]]
 +
 +
<english>'''Fig. 3'''. Blocks diagram of the WISS system for identification</english>
 +
<french>'''Fig. 3'''. Schéma-bloc du système WISS pour la reconnaissance</french>
 +
</div>
 +
 +
 +
 +
 +
<english>= Team =</english>
 +
<french>= Équipe =</french>
 +
<english>
 +
* [[User:François_Grondin | François Grondin, jr.eng.]]
 +
* [http://www.gel.usherbrooke.ca/michaudf/ François Michaud, eng., Ph.D.]
 +
</english>
 
<french>
 
<french>
L'audition artificielle est de plus en plus utilisée en robotique mobile pour améliorer l'interaction humain-robot. La reconnaissance de la parole occupe présentement une place importante tandis que la reconnaissance de locuteurs est encore peu explorée pour ce genre d'application. Le système ManyEars permet actuellement à un robot mobile de localiser, suivre et séparer plusieurs sources sonores. Ce système utilise un ensemble de huit microphones qui sont disposés en cube. Ce système de reconnaissance de locuteurs, nommé WISS (Who IS Speaking ), est couplé au système ManyEars (qui découle du projet [[AUDIBLE]]). Le système de reconnaissance de locuteurs conçu est robuste au bruit ambiant et au changement d'environnement. Une technique de parallel model combination (PMC) et des masques sont utilisés pour améliorer le taux d'identification dans un milieu bruité. Un indice de confiance est également introduit pour pondérer les identifications obtenues. La simplicité du système proposé fait en sorte qu'il est possible d'exécuter en temps réel l'algorithme sur un General Purpose Processor (GPP).
+
* [[User:François_Grondin | François Grondin, ing.jr.]]
 +
* [http://www.gel.usherbrooke.ca/michaudf/ François Michaud, ing., Ph.D.]
 
</french>
 
</french>
  
<english>= AUTHORS =</english>
+
<english>= Source code =</english>
<french>= AUTEURS =</french>
+
<french>= Code source =</french>
 +
 
 +
<english>This project is open source and available for the Matlab/Octave environments on [https://github.com/introlab/WISS GitHub].</english>
 +
<french>Le code source de ce projet est ouvert et disponible pour les environnements Matlab/Octave sur [https://github.com/introlab/WISS GitHub].</french>
  
= VIDÉOS =  
+
<english>= Videos =</english>
 +
<french>= Vidéos =</french>
 
<center>
 
<center>
<code>{{#ev:youtube|Acfxl3oqg90}}</code>
+
{{#ev:youtube|Acfxl3oqg90}}
 
</center>
 
</center>
  
= PUBLICATIONS =
+
= Publications =
 +
#Grondin, F., Michaud, F. (2012), "WISS, a Speaker Identification System for Mobile Robots," Proceedings of the International Conference on Robotics and Automation: 1817-1822 ([[Media:Grondin2012wiss.pdf|pdf]])
 +
#Grondin, F., Reconnaissance de locuteurs pour robot mobile, Mémoire de maîtrise, Département de génie électrique et de génie informatique, Université de Sherbrooke. ([[Media:MemoireGrondin.pdf|pdf]])

Latest revision as of 19:16, 28 November 2018

Description

Artificial audition recently became popular in mobile robotics in order to enhance the human-robot interaction. Speech recognition is the main field of interest whereas speaker recognition receives little attention. The ManyEars system (based on the AUDIBLE project) allows a mobile robot to localize, track and separate multiple simultaneous sound sources. This system uses an array of eight microphones disposed in a cubic shape. This speaker recognition system, named WISS (Who IS Speaking), is coupled to the ManyEars system. This speaker recognition system is robust to noise and dynamic environments. Parallel model combination (PMC) and masks are used to increase the identification rate within a noisy environment. A confidence value is also introduced to weight the obtained identifications. The simplicity of this system makes it suitable for real-time applications on a General Purpose Processor (GPP).


ManyEars Overview v2.png

Fig. 1. Blocks diagram of the ManyEars system



Wiss entrainement v4.png

Fig. 2. Blocks diagram of the WISS system for training



Wiss evaluation v3.png

Fig. 3. Blocks diagram of the WISS system for identification



Team[edit]


Source code[edit]


This project is open source and available for the Matlab/Octave environments on GitHub.


Videos[edit]

Publications

  1. Grondin, F., Michaud, F. (2012), "WISS, a Speaker Identification System for Mobile Robots," Proceedings of the International Conference on Robotics and Automation: 1817-1822 (pdf)
  2. Grondin, F., Reconnaissance de locuteurs pour robot mobile, Mémoire de maîtrise, Département de génie électrique et de génie informatique, Université de Sherbrooke. (pdf)