Carole Millot

Présentation et contact

Je suis doctorante en première année au Laboratoire de Phonétique et Phonologie à Paris, en codirection avec l’Institut National de Recherche en Sciences et Technologies du Numérique (INRIA). Ma thèse s’effectue sous la direction de Cédric Gendrot (LPP) et Jean-François Bonastre (INRIA).

I am a first-year PhD student at Laboratoire de Phonétique et Phonologie (LPP) and Institut National de Recherche en Sciences et Technologies du Numérique (INRIA) in Paris, under the supervision of Cédric Gendrot (LPP) and Jean-François Bonastre (INRIA).

Contact :

Adresse postale : Maison de la Recherche, 4 rue des Irlandais, 75005 PARIS


Depuis mon master, mes intérêts de recherche se portent vers la phonétique acoustique et l’association de la phonétique à l’informatique. Ainsi, ma thèse porte sur l’explicabilité des systèmes de reconnaissance de locuteur par la phonétique acoustique et les paramètres de qualité de voix.

Intitulée « Profilage vocal par des paramètres de qualité de la voix », elle vise à la caractérisation explicite de la voix dans le cadre de l’identification vocale des individus. Cette caractérisation facilitera l’explicabilité des résultats des systèmes de reconnaissance de locuteur et permettra le profilage d’une voix même si celle-ci leur est inconnue.

I am interested in acoustic phonetics and NLP, thus my research focuses on the explicability of automatic speaker recognition systems by acoustic phonetics and voice quality parameters.

Entitled “Voice profiling using voice quality parameters”, my PhD research aims to explicitly characterize voice in the contexte of vocal identification of individuals. This characterization would enable explicability of speaker recognition systems results and voice profiling, even in the event the actual speaker is unknown by the system.


Zellou, G., Kim, L., Gendrot, C. (submitted). Comparing how human listeners and convolutional neural networks use coarticulatory vowel nasalization for linguistic classification. Journal of Phonetics.
Ben-Amor, I. & Bonastre, J. F. (2022). BA-LR: Binary-Attribute-based Likelihood Ratio Estimation for forensic voice comparison. In 2022 International Workshop on Biometrics and Forensics (IWBF) (pp. 1-6). IEEE.
Chanclu, A., Amor, I. B., Gendrot, C., Ferragne, E., & Bonastre, J. F. (2021). Automatic classification of phonation types in spontaneous speech: towards a new workflow for the characterization of speakers’ voice quality. In Interspeech 2021 (pp. 1015-1018). ISCA.
Ferragne, E., Gendrot, C., & Pellegrini, T. (2019). Towards phonetic interpretability in deep learning applied to voice comparison. 19th International Congress of Phonetic Sciences. (pp. ISBN-978).
Gendrot, C., Ferragne, E., & Pellegrini, T. (2019). Deep learning and voice comparison: phonetically-motivated vs. automatically-learned features. 19th International Congress of Phonetic Sciences.
