REVOIX

Restitution de la Voix d’Origine pour Handicapés de la Parole

ANR-09-ETEC-005-02

Projet financé dans le cadre du programme ANR Emergence-TEC édition 2009

2 équipes partenaires :

  • UMR 7018 Laboratoire de Phonétique et Phonologie ; resp. Lise Crevier-Buchman
  • Laboratoire d’Electronique ESPCI-ParisTech ; resp. Bruce Denby

Coordinateur principal : Bruce DENBY (ESPCI)

9 participants (par ordre alphabétique et par équipe) :

  • LPP : Lise Crevier-Buchman, Cécile Fougeron, Claire Pillot Loiseau, Cédric Gendrot, Jacqueline Vaissière, Antonia Colazo Simon
  • ESPCI : Bruce Denby, Gérard Dreyfus, Pierre Roussel

Durée du projet : 2009 – 2011

Résumé en français :

Le projet REVOIX propose de réaliser une prothèse vocale susceptible de restituer leur voix d’origine aux personnes ayant perdu l’usage de la parole à la suite d’une laryngectomie totale ou partielle, ou d’une atteinte neurologique. Produisant un signal de synthèse qui reproduit aussi fidèlement que possible la voix du patient, le dispositif offrira aux personnes atteintes de ce handicap la possibilité d’améliorer sensiblement leur qualité de vie. Les travaux réalisés dans REVOIX s’appuient sur un procédé élaboré dans nos laboratoires, actuellement en cours de dépôt de brevet [Hueber2009]. Deux scénarios de valorisation du procédé au-delà de ce brevet peuvent être envisagés dans le cadre de REVOIX :
la création d’une entreprise en partenariat avec un fabricant d’instrumentation médicale
la cession de licences des technologies développées dans le projet.

Le projet REVOIX propose de réaliser un dispositif portatif permettant de restituer la voix d’origine aux handicapés de la parole, en pilotant un synthétiseur vocal à partir d’imagerie en temps réel de la langue et des lèvres réalisée avec un échographe miniature et une caméra vidéo. Le synthétiseur vocal étant conçu par des techniques d’apprentissage artificiel, cet apprentissage peut être effectué à l’aide d’enregistrements de la voix d’origine de l’utilisateur avant l’ablation du larynx : le dispositif produira ainsi un signal fidèle à la voix du locuteur. Le système développé dans REVOIX offrira ainsi aux patients souffrant de ce handicap une alternative à l’électrolarynx et à la voix trachéo-œsphagienne, qui est d’utilisation simple et intuitive, totalement non invasive ; de plus, elle seule permet un retour à la voix d’origine de l’utilisateur ; elle ne sera pas limitée par les contraintes d’apprentissage d’un mécanisme non physiologique de production vocale ni par les complications des traitements souvent associés aux laryngectomies. Il est généralement admis (l’Association des laryngectomisés) que « la perte de voix est une angoisse extrême ». Savoir qu’il y aura toujours une solution « sonore » après une intervention mutilant la voix, ou plus largement au décours d’une maladie, ou encore à la suite d’un traumatisme réduisant les possibilités de communication orale, peut être un facteur très important dans la prise en charge des patients et leur espoir de qualité de vie.

Les technologies dans REVOIX s’inscrivent dans un nouveau domaine appelé « interface de parole silencieuse », ou silent speech interface (SSI), actuellement en pleine émergence sur le plan international [Denby2009]. Des laboratoires en France, en Allemagne, au Royaume-Uni, au Japon, et aux Etats-Unis, visent sensiblement le même créneau que celui qui constitue la cible de REVOIX. Ces équipes proposent des approches technologiques assez diverses, certaines à l’état embryonnaire, d’autres plus avancées ; toutefois, au vu des résultats obtenus à ce jour, l’approche échographique de REVOIX semble la plus proche du but. Toujours dans le contexte des SSI, REVOIX aura un intérêt également dans le secteur des télécommunications, autour de la réalisation d’un « téléphone silencieux » permettant à son utilisateur de communiquer oralement, mais en silence total.

Résumé en anglais :

REVOIX proposes to build a vocal prosthesis to restore the original voice to persons who have lost the ability to speech as a result of a total or partial laryngectomy or neurological incident. The device will significantly enhance the quality of life of persons with such a handicap, by producing a synthesised signal as recognisable as possible as the original voice of the patient. The research to be carried out in REVOIX is based upon a process developed in our laboratories, which is currently being patented [Hueber2009]. Exploitation our results beyond this initial patent will be carried out in REVOIX via one of two scenarios : – creation of a startup company in a partnership with a manufacturer of medical instrumentation ; – the transfer of licenses for the technologies developed in our project.

REVOIX proposes to build a portable device to restore the original voice of speech handicapped persons by controlling a voice synthesizer with real time images of the tongue and lips, taken with a miniature ultrasound machine and a video camera. The synthesizer is based upon statistical learning techniques, which can use as input recordings of the user’s voice made before ablation of the larynx : the device will thus produce a signal recognizable as the speaker’s original voice. The system developed in REVOIX will offer speech handicapped persons an alternative to the electrolarynx and TES which is simple and intuitive to use, completely non-invasive, and the only one of these solutions allowing to restore the original voice. It furthermore does not require a learning period with a non-physiological voice production apparatus, and will be largely free of the complications of treatments which often accompany laryngectomy. It is generally accepted, (Association des laryngectomisés) that “loss of voice is a traumatizing experience“. Knowing that a natural sounding solution will still exist after an operation which destroys the vocal instrument, or more generally, after a disease or incident which diminishes the possibility for oral communication, can be a very important factor in the doctor-patient relationship, not to mention the general outlook and life quality of the patients themselves.

The solutions proposed in REVOIX are part of the new field of “Silent Speech Interfaces”, SSI, which is currently emerging internationally [Denby2009]. Laboratories in France, Germany, the UK, Japan, and the United States are currently targeting applications similar to that proposed by REVOIX. The different teams are proposing quite a wide range of approaches, some of them in the early development stages, and others more mature ; as of today, however, the ultrasound approach of REVOIX seems closest to the desired objective. Within the SSI context, it is worth mentioning here – and we will return to this point in section 4 – that REVOIX technology should also be of interest in the telecommunications sector, in the form of a “silent telephone” allowing its user to communicate orally, but in total silence.