Soutenance de Thèse de Wenxun Fu

La soutenance aura lieu le 28 novembre 2025 à 14h, à l’adresse suivante :
Salle de conférence au RdC,
Centre Culturel Irlandais (en face de la maison de la recherche)

5, rue des Irlandais
75005 Paris

Le jury sera composé de :
  • Mme Martine Adda-Decker, DR-Université Sorbonne Nouvelle (Directrice de thèse)
  • Mme Barbara Kühnert, MDC-Université Sorbonne Nouvelle (Directrice de thèse)
  • Mme Claire Pillot-Loiseau, PR- Université Sorbonne Nouvelle (Présidente)
  • M. Fabian Santiago, MDC, HDR- Université Paris 8 (Rapporteur)
  • Mme Ioana Vasilescu, DR-Université Paris-Saclay (Rapportrice)
  • Yaru Wu, MDC- Université de Caen Normandie (Examinatrice)

 

L’accent mandarin en français: caractérisation et remédiation

La qualité de l’accent étranger est fortement influencée par la langue maternelle, ce qui rend essentiel, dans l’enseignement des langues, de cibler les sons absents ou différents de la L1. Or, une prononciation précise dépasse les mots isolés : la parole naturelle inclut réductions et variations liées au style, au contexte et aux facteurs sociaux. Alors que les natifs gèrent ces changements spontanément, les apprenants L2 peinent souvent à le faire. Cette étude analyse les difficultés segmentales de locuteurs mandarin apprenant le français lors de lecture de mots, de lecture de texte et de conversation spontanée. Plus de sept heures d’enregistrements de 20 apprenants et 10 natifs révèlent plusieurs traits : voyelles arrondies moins marquées, voyelles nasales souvent confondues, réalisation de /ɥi/ avec transition insuffisante proche de /y/, et fricatives voisées fréquemment dévoisées, surtout en position finale. Les principales différences concernent la réduction vocalique et le voisement des fricatives lorsque la parole devient plus continue. Sur cette base, nous avons conçu un programme extrascolaire de formation à la prononciation utilisant des enregistrements de natifs. Trente-six apprenants du français en Chine ont suivi quatre semaines d’imitation ou de shadowing. Les posttests montrent des progrès significatifs en perception et production des fricatives voisées et de /ɥi/. Les débutants progressent davantage avec l’imitation, les intermédiaires avec le shadowing, soulignant l’importance d’adapter les méthodes au niveau. Les mots en contexte s’améliorent moins que les mots isolés, confirmant que la parole continue requiert une attention pédagogique accrue.

 

Mots clés : Français langue étrangère (FLE), acquisition en L2 dans différents styles oraux, shadowing, imitation en apprentissage de langues, apprentissage autonome à la prononciation, accent du français chez les apprenants mandarins

_________________________________________________________

The Mandarin accent in French: characterization and remediation

Foreign accent quality is strongly influenced by learners’ native language, making it crucial for L2 instruction to target sounds absent from, or different in, the L1. Yet accurate pronunciation extends beyond isolated words: natural speech includes reduction and variation shaped by style, context, and social factors. While native speakers manage these shifts naturally, L2 learners often struggle. This study examines segmental difficulties among Mandarin learners of French across isolated word reading, text reading, and spontaneous conversation. Over seven hours of data from 20 learners and 10 natives revealed key features of Mandarin-accented French: rounded vowels are less rounded than native speech; nasal vowels, absent from Mandarin, are frequently confused; /ɥi/ is produced with insufficient transition, approaching /y/; and voiced fricatives, also largely absent, are often devoiced, particularly in word-final position. The main differences between natives and learners as style shifted to more continuous speech lay in the amount of vowel reduction and the degree of fricative voicing. Based on these findings, we designed an extracurricular training program using native recordings. Thirty-six Mandarin learners of French at BLCU completed four weeks of imitation or shadowing. Post-tests showed significant gains in perception and production of voiced fricatives and /ɥi/, while progress of nasal vowels remained inconclusive. Beginners improved most with imitation, intermediates with shadowing—highlighting the need to adapt methods to proficiency. Words in sentences improved less than isolated words, confirming that continuous speech requires greater pedagogical focus.

Keywords: French as a foreign language (FFL), L2 acquisition in different speaking styles, shadowing technique, imitation in language learning, autonomous pronunciation learning, French accent of Mandarin speakers

Soutenance de Thèse de Lei Xi

La soutenance aura lieu le Jeudi 26 Juin 2025 à 9h30, au lieu suivant :

Salle Athéna, Maison de la Recherche, Université Sorbonne Nouvelle
4 Rue des Irlandais, 75005 Paris.

Devant un jury composé de :

  • Mme Elisabeth DELAIS-ROUSSARIE, DR – CNRS (rapportrice)
  • M. Frederic ISEL, PR – Université Paris Nanterre (examinateur)
  • Mme Sharon PEPERKAMP, DR – CNRS (rapportrice)
  • Mme Claire PILLOT-LOISEAU, PR – Université Sorbonne Nouvelle (examinatrice)
  • M. Rachid RIDOUANE, DR – CNRS (directeur de thèse)

———————————-Résumé ——————————————-

L’acquisition de la prosodie du français par des apprenants sinophones : Études acoustique, perceptive et électroencéphalographique

Bien que centrale dans la communication parlée, la prosodie reste un domaine moins exploré dans les travaux de recherche sur l’acquisition des langues secondes. Cette thèse traite de la segmentation et de l’organisation prosodiques en français chez des locuteurs natifs francophones et des apprenants sinophones de trois niveaux (débutants, intermédiaires, avancés).

La prosodie assume notamment deux rôles clés : délimiter les unités syntaxiques et structurer le flux temporel-rythmique. Le mandarin, utilisant des tons lexicaux, mobilise différemment ces éléments, comparé au français. Notre recherche cherche à montrer comment les apprenants sinophones acquièrent la prosodie française pour traiter des ambiguïtés syntaxiques locales, illustrées par des phrases à clôture précoce (CP : « Chaque fois que le serpent mangeait, le rat se cachait. ») ou tardive (CT : « Chaque fois que le serpent mangeait le rat, le lapin se cachait. »). Pour cela, des données acoustiques (31 locuteurs : 10 natifs, 21 apprenants), perceptives (60 auditeurs : 20 natifs, 40 apprenants) et électroencéphalographiques (60 participants : 20 natifs, 40 apprenants) ont été analysées, totalisant 151 individus.

Les résultats acoustiques révèlent que dès le niveau intermédiaire, les apprenants utilisent la montée du F0 et l’allongement final pour signaler les frontières CP et CT. Concernant l’organisation prosodique, les valeurs de neuf paramètres quantitatifs (%V, ΔC et ∆V, VarcoV et VarcoC, nPVI-V et rPVI-C, CCI-C et CCI-V) ont révélé une même tendance dans l’évolution du patron rythmique : il devient de plus en plus stable à mesure que le niveau de français progresse. Sur le plan perceptif, les apprenants (et, dans une moindre mesure, les natifs) rencontrent des difficultés accrues avec les structures complexes comme la CP. Les données EEG montrent que les frontières CP et CT activent une closure positive shift (CPS) chez tous les groupes, confirmant leur traitement neurocognitif. Une neuroplasticité est suggérée par les variations topographiques des CPS entre natifs et apprenants durant le traitement de la CP. La ramp-like negativity, observée pour la CT, reflète un processus top-down chez les natifs contre un mécanisme bottom-up chez les apprenants lors de l’analyse des indices acoustiques.

En conclusion, cette recherche contribue à la compréhension de l’acquisition prosodique en L2 et met en lumière les différences comportementale et neurocognitive dans le traitement des frontières prosodiques localement ambiguës entre natifs et apprenants.

Mots clés : français, chinois mandarin, prosodie, frontière prosodique, acquisition, acoustique, perception, EEG, potentiel évoqué, CPS

———————————-Abstract——————————————-

Acquisition of French prosody by Chinese learners: acoustic, perceptive and electroencephalographic studies

Despite its central role in spoken communication, prosody remains a less explored area in second language acquisition research. This thesis investigates performance of French prosodic segmentation and organization in native speakers and Chinese L2 learners across three proficiency levels: beginner, intermediate, and advanced.

Prosody serves two primary functions in language, namely, delimiting syntactic units and regulating the temporal flow of speech. Mandarin, using lexical tones, mobilizes prosodic features differently from French. This thesis aims to investigate how Chinese L2 learners acquire French prosody to deal with local syntactic ambiguities, as exemplified by sentences exhibiting early closure (EC: « Chaque fois que le serpent mangeait, le rat se cachait. », “Whenever the snake was eating, the rat would hide. ») and late closure (LC: « Chaque fois que le serpent mangeait le rat, le lapin se cachait. », « Whenever the snake was eating the rat, the rabbit would hide. »). The analysis involved acoustic (31 subjects: 10 natives, 21 learners), perceptual (60 participants: 20 natives, 40 learners), and electroencephalographic (60 participants: 20 natives, 40 learners) data, encompassing a total of 151 individuals.

The acoustic results reveal that learners employ F0 rising and final lengthening to signal EC and LC boundaries from the intermediate level onward. In terms of prosodic organization, nine rhythm metrics (%V, ΔC and ΔV, VarcoV and VarcoC, nPVI-V and rPVI-C, CCI-C and CCI-V) show a consistent trend in rhythmic pattern development: it becomes increasingly more stable as proficiency in French advances. Perceptually, learners (and to a lesser extent, natives) encounter challenges with complex structures like EC. The EEG data indicate that both EC and LC boundaries elicited a closure positive shift (CPS) across all participant groups, underscoring their neurocognitive processing. Neuroplasticity is implied by the distinct topography of CPS between natives and learners during EC processing. The ramp-like negativity observed in LC condition reflects a top-down process in natives versus a bottom-up mechanism in learners when deciphering prosodic cues.

In summary, this thesis enhances our comprehension of L2 prosodic acquisition and provides novel perspectives on the behavioral and neurocognitive differences in the interpretation of local ambiguous prosodic boundaries between native French speakers and Chinese L2 learners.

Keywords: French, Mandarin Chinese, prosody, prosodic boundary, acquisition, acoustics, perception, EEG, ERP, CPS

Soutenance de Thèse de Clémence Guieu-Grandsire

La soutenance aura lieu le 19 Mars 2025 à 14h, au lieu suivant :

Université Sorbonne Nouvelle – Paris 3
Campus Nation – Salle A608 (Bâtiment A – 6ème étage)
8 avenue de Saint Mandé, 75012 Paris

Devant un jury composé de :

  • Sophie WAUQUIER, Professeure des universités – Université Paris 8 (examinatrice)
  • Yvan ROSE, Professeur des universités – Memorial University of Newfoundland (rapporteur)
  • Evgenia MAGOULA, Professeure des universités – National and Kapodistrian University of Athens (rapportrice)
  • Letícia ALMEIDA, Professora Auxiliar – Universidade de Lisboa (examinatrice)
  • Shigeko SHINOHARA, Chargée de Recherche Hors Classe HDR – CNRS (directrice de thèse)
  • Naomi YAMAGUCHI, Maîtresse de Conférences – Université Sorbonne Nouvelle (co-directrice de thèse)

Il sera également possible d’y assister à distance par Zoom, un lien vous sera communiqué ultérieurement. La présentation aura lieu en français.

À l’issue de la soutenance, un pot suivra en salle A609.

———————————-Résumé ——————————————-
Cette thèse explore, à travers une étude semi-longitudinale, l’acquisition phonologique segmentale et syllabique chez des enfants bilingues et monolingues franco-grecs en se concentrant spécifiquement sur l’acquisition des rhotiques /ʁ/ et /ɾ/ et sur les clusters Obstruante + Liquide (OL) en perception et en production.
Des données ont été collectées trois fois tous les six mois auprès de 26 enfants au développement typiques âgés de 2 ;8 à 6 ;2 : huit monolingues francophones, sept monolingues hellénophones, et onze bilingues franco-grecs, dont six vivant en France et cinq en Grèce. Pour examiner précisément l’influence de l’input sur le développement phonologique bilingue, nous avons catégorisé les profils d’input individuels reçu par les onze enfants bilingues de notre étude à partir d’une combinaison de données naturelles sur l’environnement linguistique familial (recueillies avec le dispositif LENA) et des données estimées sur l’environnement linguistique extra-familial (recueillies avec des questionnaires parentaux). Cette méthodologie novatrice a permis de comparer le développement phonologique des bilingues selon le profil d’input reçu (dominant en français, équilibré ou dominant en grec) avec celui des monolingues dans chaque langue.
Nos résultats montrent que les bilingues développent des systèmes phonologiques globalement similaires à ceux des monolingues, avec certaines interactions spécifiques entre les systèmes, liées à la fois au statut bilingue et modulée par le profil de l’input reçu dans chaque langue. Par exemple, tous les enfants acquièrent /ʁ/ avant /ɾ/ mais les bilingues dont l’input est dominant en français montrent un délai important dans l’acquisition de /ɾ/ et des clusters spécifiques au grec comme /ɣɾ/ et /ɣl/ comparés aux monolingues hellénophones et aux bilingues dont l’input est dominant en grec. Ce délai s’accompagne également d’un transfert temporaire où /ɾ/ est substitué par [ʁ] mais uniquement chez les bilingues dont l’input est dominant en français ou équilibré. À l’inverse, les structures syllabiques partagées comme les occlusive + latérale en français, le constituant coda interne ou la structure OL en grec sont acquis plus tôt chez les bilingues que chez les monolingues.
Pour rendre compte de ces interactions, nous proposons un modèle intégratif de l’acquisition phonologique bilingue montrant que le profil de l’input influence principalement l’acquisition des propriétés complexes spécifiques à chaque langue. Ce modèle suggère que l’enfant bilingue recevant un input « non-dominant » dans la langue contenant la propriété complexe pourra acquérir plus tardivement cette propriété comparé à ses pairs monolingues ou bilingues recevant un input dominant dans cette langue, surtout lorsqu’il existe une propriété moins complexe acquise dans l’autre langue.
Cette recherche enrichit les modèles théoriques proposés pour rendre compte de l’acquisition phonologique, en élargissant leur application à des contextes bilingues peu étudiés. Elle clarifie également le rôle de l’input sur l’acquisition bilingue en mettant en évidence une influence limitée aux propriétés spécifiques complexes. Elle souligne ainsi l’importance d’une approche interactive des facteurs internes et externes à la langue dans le développement phonologique bilingue.

———————————-Abstract——————————————-
This dissertation investigates, through a semi-longitudinal study, the segmental and syllabic phonological acquisition in bilingual and monolingual French-Greek children, with a specific focus on the acquisition of the rhotics /ʁ/ and /ɾ/ and Obstruent + Liquid (OL) clusters in both perception and production.
Data were collected three times at six-month intervals from 26 typically developing children aged 2;8 to 6;2: eight monolingual French-speaking children, seven monolingual Greek-speaking children, and eleven bilingual French-Greek children, six living in France and five in Greece. To precisely examine the influence of input on bilingual phonological development, we categorized the input profiles of the eleven bilingual children based on a combination of naturalistic data on their home linguistic environment (collected using the LENA system) and estimated data on their extra-familial linguistic exposure (gathered through parental questionnaires). This innovative methodology allowed us to compare bilingual phonological development according to input profiles (French-dominant, balanced, or Greek-dominant) with that of monolinguals in each language.
Our results show that bilingual children develop phonological systems broadly similar to those of monolinguals, with specific interactions between the two systems influenced both by bilingual status and modulated by the input profile in each language. For instance, all children acquired /ʁ/ before /ɾ/, but bilinguals with a French-dominant input profile exhibited a significant delay in acquiring /ɾ/ and Greek-specific clusters such as /ɣɾ/ and /ɣl/ compared to monolingual Greek-speaking children and bilinguals with a Greek-dominant input profile. This delay was also accompanied by a temporary transfer phenomenon, where /ɾ/ was substituted by [ʁ], but only in bilinguals with a French-dominant or balanced input profile. Conversely, shared syllabic structures, such as plosive + lateral in French, the internal coda constituent or OL structure in Greek, were acquired earlier by bilinguals than by monolinguals.
To account for these interactions, we propose an integrative model of bilingual phonological acquisition, demonstrating that input profiles primarily influence the acquisition of complex properties specific to each language. This model suggests that a bilingual child receiving « non-dominant » input in the language containing the complex property may acquire it later than their monolingual or bilingual peers receiving dominant input in that language, particularly when a less complex equivalent property is acquired in the other language.
This research contributes to theoretical models of phonological acquisition by extending their application to underexplored bilingual contexts. It also clarifies the role of input in bilingual acquisition, highlighting its influence as being limited to language-specific complex properties. Ultimately, this study underscores the importance of an interactive approach to internal and external linguistic factors in bilingual phonological development.

Soutenance de Thèse de Philipp Buech

La soutenance aura lieu le Vendredi 31 janvier 2025 à partir de 9h30, au lieu suivant :

Maison de la Recherche
Université Sorbonne Nouvelle
Salle du Conseil
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Nicolas AUDIBERT, MCF – Université Sorbonne Nouvelle (examinateur)
  • Ioana CHITORAN, PR – Université Paris Cité (examinatrice)
  • Alexei KOCHETOV, PR – University of Toronto (rapporteur)
  • Ian MADDIESON, PR Emeritus – University of New Mexico (examinateur)
  • Chakir ZEROUAL, PR – Université Mohamed 1er – Oujda (rapporteur)
  • Rachid RIDOUANE, DR – CNRS (directeur de thèse)
  • Anne HERMES, CRCN – CNRS (co-directrice de thèse)

 

Articulations secondaires en tachlhit : Articulation et acoustique de la labialisation et de la pharyngalisation

Les articulations secondaires sont des constrictions de moindre degré superposées à une autre constriction primaire plus forte, principalement signalées sur les voyelles environnantes. Le tachlhit, une langue amazighe parlée au Maroc, fait partie des rares langues qui possèdent deux articulations secondaires : la labialisation dans l’ensemble des dorsales et la pharyngalisation dans l’ensemble des coronales. Ces contrastes n’ont pas encore été explorés phonétiquement dans cette langue. Le tachlhit se distingue également par sa forte utilisation de séquences de consonnes, où l’on peut trouver des consonnes avec des articulations secondaires. La question se pose de savoir comment ces articulations se manifestent phonétiquement lorsque l’environnement immédiat du segment pharyngalisé ou labialisé est partiellement ou entièrement occupé par des consonnes.
Cette thèse vise à analyser les caractéristiques articulatoires et acoustiques de la labialisation et de la pharyngalisation en tachlhit dans les productions de logatomes et dans les productions de mots contenant diverses séquences. Les données articulatoires recueillies par EMA auprès de six locuteurs, ainsi que les données acoustiques recueillies auprès de 35 locuteurs ont été analysées. Les résultats montrent des mécanismes articulatoires distincts pour les deux contrastes, mais qui ciblent tous les deux le formant F2 dans les voyelles environnantes en tant que corrélat acoustique primaire. En outre, la labialisation se limite aux segments immédiatement adjacents, tandis que la pharyngalisation s’étend à des domaines plus vastes. Les résultats sont utilisés pour éclairer la représentation phonologique de ces articulations secondaires.

 

Secondary articulations in Tashlhiyt: Articulation and acoustics of labialization and pharyngealization

Secondary articulations are constrictions of a lesser degree superimposed on another stronger primary constriction, mostly signaled on surrounding vowels. Tashlhiyt, an Amazigh language spoken in Morocco, is one of the rare languages with two contrastive secondary articulations. These are labialization in the set of dorsals and pharyngealization in the set of coronals, two contrasts that have not yet been explored phonetically in this language. Tashlhiyt is also notable for its strong use of consonant sequences, where consonants with secondary articulations can occur. The question arises as to how these secondary articulations are phonetically manifested when consonants partly or entirely occupy the immediate segment environment.

This thesis aims to analyze the articulatory and acoustic characteristics of labialization and pharyngealization in Tashlhiyt in logatome productions and word productions containing diverse sequences. For this investigation, articulatory data collected via electromagnetic articulography (EMA) from six speakers, as well as acoustic data collected from 35 speakers, were analyzed.
The results show distinct articulatory mechanisms for labialization and pharyngealization that both target the F2 formant in surrounding vowels as the primary acoustic correlate. In addition, labialization is restricted only to immediately adjacent segments, while pharyngealization extends into larger domains. The findings are used to inform the phonological representation of these secondary articulations.

 

Soutenance de Thèse de Boram Lee

La soutenance aura lieu le jeudi 5 décembre à 15h00 à l’adresse suivante :

Université Sorbonne Nouvelle – Paris 3
Campus Nation – Salle A608
8 avenue de Saint Mandé, 75012 Paris

 

Devant le jury composé de :

  • Jeffrey STEELE (Rapporteur), PU, University of Toronto
  • Marc DUVAL (Rapporteur), MCF(HDR), Sorbonne Université
  • Claire PILLOT-LOISEAU (Examinatrice), PU, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle
  • Jiyoung CHOI (Examinatrice), MCF, INALCO
  • Cécile Fougeron (Directrice), DR, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle
  • Naomi YAMAGUCHI (Co-directrice), MCF, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle

 

Résumé
Cette thèse explore l’acquisition du contraste laryngal coréen à 3 catégories (lenis, fortis, aspirée) par 21 apprenantes francophones sur un an.
En perception, une tâche d’identification sur des stimuli naturels (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) révèle des difficultés avec la lenis, alors que l’aspirée et la fortis s’améliorent. L’analyse des poids relatifs du VOT et de la f0 sur stimuli synthétisés (/t/, /tʰ/, /t*/) montre des différences avec les coréanophones (KR) : 1) poids plus important du VOT pour aspirée vs fortis (comme KR) ; 2) poids plus important sur la f0 pour fortis vs lenis (KR: poids équivalents de deux indices) ; 3) poids similaires de deux indices pour aspirée vs lenis (KR: f0 plus importante).
En production, la tâche de répétition (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) montre une distinction du VOT (fortis vs aspirées et lenis), et de la f0 (lenis vs aspirées et fortis), avec des poids relatifs similaires aux KR. Cependant, la tâche de lecture diffère : la lenis produite avec un VOT court. Les poids relatifs du VOT et de la f0 varient entre occlusives (OCC) et affriquées (AFF), sauf pour aspirée vs fortis (VOT plus important) : pour fortis vs lenis, poids similaires de deux indices (OCC), poids supérieur sur la f0 (AFF) ; pour lenis vs aspirée, poids supérieur sur le VOT (OCC), poids similaires de deux indices (AFF).
La perception précède généralement la production, avec une variabilité persistante, mais une influence mutuelle complexe existe. L’acquisition phonétique complète nécessite plus d’un an. Cependant, la réorganisation en 3 catégories et l’intégration de la f0 sont acquises, montrant une réussite phonologique avant la maîtrise phonétique.
Abstract
Korean three-way laryngeal contrast (lenis, fortis, aspirated) employs both VOT and f0, unlike French binary laryngeal contrasts realized solely by VOT. This study explores the acquisition of the three- way laryngeal contrast by 21 French learners over one year.
In perception, the results reveal persistent difficulties with lenis identification, while aspirated and fortis improved over time. Cue weighting of VOT and f0 showed that category learners differed from Korean natives (KR): 1) using VOT heavily for aspirated vs. fortis (similar to KR); 2) using f0 heavily for fortis vs. lenis (KR: use both VOT and f0 cue); 3) using both VOT and f0 cue for aspirated vs. lenis (KR: using f0 heavily).
In production, the repetition task (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) a difference in VOT (short vs. long) for fortis vs. aspirated & lenis as well as a difference in f0 (low vs. high) for lenis vs. aspirated & fortis, with similar cue weighting to KR. However, the reading task differs: lenis produced with a short VOT. The cue weighting varies between stop and affricate, except for aspirated vs. fortis (using VOT heavily) : for fortis vs. lenis, similar use of two cue (stop), using f0 heavily (affricate) ; for lenis vs. aspirated, greater use on VOT (stop), similar use of two cue (affricate).
In this study, perception generally precedes production, with persistent variability, but a complex interaction exists. Our findings indicate that phonetic acquisition of three-way contrasts requires more than a year of learning. However, the learners have reorganized the contrast from two to three-ways and have integrated the acoustic cue of f0 well to be able to make this three-way distinction.

 

Soutenance de Thèse d’Amélie Elmerich

La soutenance aura lieu le mercredi 26 juin à 13h30 à l’adresse suivante :

Maison de la Recherche – Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais 75005 Paris

 

Devant le jury composé de :

  • Béatrice Vaxelaire (Rapporteur), PR (LiLPa, EA1339, Uni. de Strasbourg)
  • Yves Laprie (Rapporteur), DR (Loria, UMR 7503, CNRS/ Uni. de Lorraine)
  • Justin Michel (Examinateur), PU-PH (Aix-Marseille Uni.)
  • Solange Rossato (Examinatrice), MCF (LIG, UMR5217, CNRS/ Uni. Grenoble Alpes)
  • Lise Crevier-Buchman (Directrice), CR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Angélique Amelot (Co-directrice), IR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Jean-François Papon (Co-directeur), PU-PH (Uni. Paris Saclay)

 

La soutenance sera également accessible en visioconférence. Le lien Zoom sera disponible prochainement.

Résumé :

Cette thèse s’intéresse à l’évaluation multiparamétrique de la nasalité à travers quatre axes : aérodynamique, acoustique, volumétrique et perceptif. Ce travail a été l’occasion de parfaire le développement d’un outil d’acquisition aérodynamique : un masque en fibre de papier. Ce masque nous a permis de pallier certains inconvénients des outils d’acquisition aérodynamiques actuels. L’objectif principal était de contribuer à la compréhension de la perturbation de la nasalité dans le cadre de la polypose naso-sinusienne et sa chirurgie. Notre population était composée de quatre patients atteints de polypose naso-sinusienne enregistrés avant et après chirurgie que nous avons comparé à une population de huit locuteurs sains. Notre corpus comprenait des logatomes de type VCV. Outre la variabilité individuelle, nos résultats montrent que la population pathologique reste proche des locuteurs sains pour les études aérodynamique, acoustique et perceptive. En effet, les patrons aérodynamiques des patients sont similaires à ceux des locuteurs sains de même que les moyennes de DAN et de DAO calculées sur chaque phonème. Pour l’étude acoustique, nous avons examiné la durée des voyelles et le spectre moyen oral et nasal. La différence de durée entre voyelles orales et nasales se maintient en préopératoire et postopératoire. Les moyennes de spectre moyen oral et nasal des patients sont proches des locuteurs sains. Pour l’étude volumétrique, à partir de scanners, les volumes d’air naso-sinusiens ont été calculés avant et après chirurgie. Une augmentation du volume a été noté en postopératoire, volume qui se rapproche de celui du témoin. Enfin, l’étude perceptive a montré que la voix et la parole ne sont pas un handicap pour le patient et que la qualité vocale des patients n’est pas perçue comme altérée. La relation entre l’aérodynamique, acoustique, volumétrique et perceptive s’avère complexe. Nous n’avons pas pu relever de liens tangibles en raison notamment de la forte variabilité individuelle. La pathologie ainsi que la chirurgie ne semblent pas perturber la voix et la parole des patients. Nos résultats sont novateurs en étant les premiers à montrer l’efficacité de l’AeroMask pour l’étude de la nasalité.

Mots-clés : Nasalité, Polypose naso-sinusienne, Multiparamétrique, Instrumentation, AeroMask, DAN, DAO, acoustique, perception

Abstract: Multiparametric assessment of nasality: Design and use of an aerodynamic mask applied to a control and pathological population : the AeroMask

This thesis focuses on the multiparametric assessment of nasality through four axes: aerodynamic, acoustic, volumetric and perceptual. This work was an opportunity to perfect the development of an aerodynamic acquisition tool: a paper-fiber mask. This mask enabled us to overcome some of the drawbacks of current aerodynamic acquisition tools. The main objective was to contribute to the understanding of nasal disturbance in the context of nasal polyposis and its surgery. Our population consisted of four patients with nasal polyposis recorded before and after surgery, which we compared with a population of eight healthy speakers. Our corpus included VCV logatoms. Apart from individual variability, our results show that the pathological population remains close to healthy speakers for aerodynamic, acoustic and perceptual studies. Indeed, the aerodynamic patterns of the patients are similar to those of healthy speakers, as are the averages of NAF and OAF calculated on each phoneme. For the acoustic study, we examined vowel duration and the mean oral and nasal spectrum. The difference in duration between oral and nasal vowels was maintained both pre- operatively and postoperatively. The patients’ mean oral and nasal spectra are close to those of healthy speakers. For the volumetric study, sinonasal air volumes were calculated before and after surgery, using CT scans. An increase in volume was noted postoperatively, which was close to that of the control. Finally, the perceptual study showed that voice and speech are not a handicap for the patient, and that the patients’ vocal quality is not perceived as impaired. The relationship between aerodynamics, acoustics, volumetry and perception is complex. We were unable to identify any tangible links, mainly because of the high degree of individual variability. Pathology and surgery do not seem to interfere with patients’ voice and speech. Our results are innovative in that they are the first to demonstrate the effectiveness of the AeroMask in studying nasality.

Keywords : Nasality, Nasal Polyposis, Multiparametric, Instrumentation, AeroMask, Nasal Airflow, Oral Airflow, Acoustics, Perception

Soutenance de Thèse de Dayeon Yoon

La soutenance aura lieu le jeudi 20 juin 2024 à 9h30 à l’adresse suivante :

Maison de la Recherche – Université Sorbonne Nouvelle
Salle Claude Simon
4 rue des Irlandais
75005 Paris

Elle se déroulera en présence du jury composé de :

  • Rudolph Sock (Rapporteur) Professeur, Université de Strasbourg
  • Jane Stuart-Smith (Rapporteuse) Professeur, Glasgow University
  • Melanie Weirich (Examinatrice) Professeur, Universität Jena
  • Hiyon Yoo (Examinatrice) Maître de conférence, Université Paris Cité
  • Cédric Gendrot (Examinateur) Professeur, Université Sorbonne Nouvelle
  • Nicolas Audibert (Co-directeur) Maître de conférence, Université Sorbonne Nouvelle
  • Cécile Fougeron (Directrice de thèse) Directeur de recherche HDR, CNRS

La soutenance sera en anglais et également accessible en visioconférence.

 

Lien de la visioconférence : 

https://cnrs.zoom.us/j/99365688414?pwd=RWRd3MAXy7PCW5Qn3C1eLXi7iwQwgE.1

Résumé :

Cette thèse examine les spécificités de la parole produite par les hommes et les femmes en fonction de la morphologie corporelle et de la langue parlée. Dans la première étude, les indices phonétiques segmentaux liés à la voix et à la parole d’une part, et la coarticulation nasale d’autre part, sont comparés entre 70 hommes et femmes parlant coréen ou français. Dans la seconde étude, les indices acoustiques de la parole sont reliés à la taille et au poids des locuteurs. Enfin, la capacité de 105 auditeurs coréens et français à estimer la taille et le poids des locuteurs à partir de la parole est évaluée. Des différences acoustiques entre les sexes sont observées dans la première étude, suggérant une hauteur vocale et des fréquences de résonance du conduit vocal plus élevées chez les femmes, avec un degré de souffle plus important et un degré de bruit plus faible. Ces différences entre les sexes sont plus marquées chez les Français que chez les Coréens, notamment pour le degré de souffle et de bruit. Chez les Coréens, une réduction de la nasalité de la consonne nasale en position initiale de groupe accentuel est plus marquée chez les hommes, tandis que celle de la durée est plus marquée chez les femmes. Dans la seconde étude, le lien entre les dimensions corporelles et les indices acoustiques de la parole est plus important chez les hommes. Les auditeurs sont plus performants dans l’estimation de la taille des locuteurs dépassant une certaine taille, correspondant à celle des hommes étudiés. Ces résultats sont discutés en relation avec le rôle de la parole en tant que marqueur sociophonétique d’une part, et en tant que marqueur de dominance physique dans la sélection sexuelle d’autre part.

Mots clés : morphologie corporelle, variation inter-langues, voix, parole, coarticulation nasale, coréen, français

Abstract: Effects of body morphology and spoken language on male and female speech

This thesis investigates the specificities of speech produced by male and female speakers as a function of body morphology and spoken language. In the first study, segmental phonetic cues related to voice and speech on one hand, and nasal coarticulation on the other hand, are compared between 70 male and female speakers of Korean or French. In the second study, acoustic cues of speech are linked to the height and weight of speakers. Finally, the ability of 105 Korean and French listeners to estimate the height and weight of speakers from speech is evaluated. Acoustic differences between sexes are observed in the first study, suggesting higher vocal pitch and resonance frequencies of the vocal tract in female speakers, with a higher degree of breathiness and lower degree of noise. These sex differences are more pronounced among French speakers than among Koreans, especially in terms of breathiness and noise. Among Koreans, a reduction in the nasality of nasal consonants in the initial position of accentual groups is more pronounced in male speakers, while that of duration is more pronounced in female speakers. In the second study, the link between bodily dimensions and acoustic cues of speech is stronger among male speakers. Listeners are more accurate in estimating the height of speakers exceeding a certain height, corresponding to that of the male speakers studied in this thesis. These results are discussed in relation to the role of speech as a sociophonetic marker on one hand, and as a marker of physical dominance in sexual selection on the other hand.

Keywords: body morphology, crosslinguistic variation, voice, speech, nasal coarticulation, Korean, French 

Soutenance de Thèse de Jinyu Li

La soutenance aura lieu le mardi 19 décembre 2023 à 16 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Mezzanine
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Pascal PERRIER (Rapporteur) : Professeur, Grenoble INP/Université Grenoble Alpes
  • Corine ASTESANO (Rapportrice) : Professeur, Université Toulouse – Jean Jaurès
  • Louis GOLDSTEIN (Examinateur) : Professeur, University of Southern California
  • Noël NGUYEN (Examinateur) : Professeur, Aix-Marseille Université
  • Yao YAO (Examinateur) : Professeur adjoint, Hong Kong Polytechnic University
  • Cécile FOUGERON (Directrice) : Directrice de recherche, Université Sorbonne Nouvelle
  • Leonardo LANCIA (Directeur) : Chargé de recherche, Aix-Marseille Université

 

La soutenance sera en anglais et également accessible en visioconférence.

 

Lien de la visioconférence : 

https://cnrs.zoom.us/j/93499505383?pwd=QWZtWUlicng0T2JMSEl5NlIxUXAwQT09


ID de réunion : 934 9950 5383

Code secret : cYv4cj

 

Résumé :

Pour s’adapter aux imprévus lors de la production de la parole, le système moteur intègre les informations sensorielles (ex. le retour auditif), et bénéficie du groupement rythmique, qui est caractérisé par la prosodie. Cependant, le système sensorimoteur d’un locuteur traite différemment les événements acoustiques relatifs à sa propre voix par rapport à ceux d’autrui. Cette thèse vise à examiner la flexibilité de la production de la parole en analysant le rôle organisateur de la prosodie et la sensation subjective d’un locuteur sur le contrôle de sa voix (c.-à-d. le sens d’agentivité relatif à sa voix).

Des expériences des perturbations du retour auditif ont été menées chez des locutrices francophones. Avec le retour auditif retardé (DAF), la différence de durée entre les voyelles accentuées et non accentuées s’est accrue, soulignant une plus grande flexibilité durant la production des accents. De plus, le DAF a induit une réorganisation du rythme de la parole avec un renforcement du groupement syllabique. Avec un décalage continu de la fréquence fondamentale (f0) du retour auditif, la majorité des locutrices ont aligné leur f0 sur celle modifiée du retour auditif, suggérant que leur système sensorimoteur aurait traité la voix perçue comme une entrée externe. La présence simultanée du DAF et d’un décalage de la f0 a entraîné une réduction des effets du DAF par rapport à la condition sans décalage de la f0. Cette observation suggère une réduction du sens d’agentivité relatif à la voix chez les locutrices, ainsi qu’une interaction entre l’organisation rythmique et le sens d’agentivité dans les processus sensorimoteurs de production de la parole.

Mots-Clés : contrôle sensorimoteur de la parole, retour auditif, rythme de la parole, structure prosodique, sens d’agentivité, alignement phonétique, traitement de la parole

 

Abstract: Interaction between rhythmic structure and sense of agency in speech production

To adapt to unforeseen circumstances during speech production, the motor system integrates sensory information (e.g., auditory feedback) and benefits from rhythmic grouping, which is characterized by prosody. However, a speaker’s sensorimotor system processes acoustic events related to their own voice differently from those of others. This thesis aims to examine the flexibility of speech production by analyzing the organizing role of both prosody and a speaker’s subjective sensation of control over his voice (i.e., the sense of agency related to his voice).

Experiments of auditory feedback perturbations were conducted with French-speaking female speakers. With delayed auditory feedback (DAF), the duration difference between accented and unaccented vowels increased, highlighting greater flexibility during accent production. Furthermore, DAF induced a reorganization of speech rhythm with enhanced syllabic grouping. With a constant shift in the fundamental frequency (f0) of auditory feedback, the majority of female speakers aligned their f0 with the modified auditory feedback, suggesting that their sensorimotor system processed the perceived voice as an external input. The simultaneous presence of DAF and an f0 shift resulted in a reduction of DAF effects compared to the condition without an f0 shift. This observation suggests a reduction in the sense of agency related to the voice among female speakers, as well as an interaction between rhythmic organization and sense of agency in sensorimotor processes of speech production.

Key words: sensorimotor control of speech, auditory feedback, speech rhythm, prosodic structure, sense of agency, phonetic alignment, speech processing

 

Soutenance de Thèse de Xinyuan Zhang

La soutenance aura lieu le mardi 12 décembre 2023 à 9 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Claude Simon
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Mme. Annie Rialland (Présidente), Directrice de Recherche émérite au CNRS, Sorbonne-Nouvelle
  • M. Marc Duval (Rapporteur), Professeur, Université de Paris IV
  • M. Guillaume Jacques (Rapporteur), Directeur de Recherche CNRS, INALCO-EHESS-EPHE
  • Mme. Jiayin Gao (Examinatrice), Chargée de Recherche CNRS, Sorbonne-Nouvelle
  • M. Anton Antonov (Examinateur), Maître de Conférences, INALCO
  • M. Pierre Hallé (Directeur), Directeur de Recherche émérite CNRS, Sorbonne-Nouvelle

 

La soutenance sera en français et également accessible en visioconférence :

https://cnrs.zoom.us/j/99001034405?pwd=RXVzS3EzdzMwRUlWaldlRkNsM01NZz09

ID de réunion: 990 0103 4405
Code secret: 3UU2DV

Vous pouvez télécharger le résumé court (Français et Anglais) en cliquant ici

 

Soutenance de Thèse de Nathalie Lévêque

La soutenance aura lieu le vendredi 3 novembre 2023 à 14 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Marina Laganaro (Rapporteur) Professeur à l’Université de Genève
  • Liziane Bouvier (Rapporteur) Professeur à l’Université Mc Gill, Québec
  • David Grabli (Examinateur) Professeur Universitaire Praticien Hospitalier, Hôpital de la Pitié-Salpêtrière, Paris
  • Claire Pillot-Loiseau (examinatrice), professeur, Université Sorbonne Nouvelle, Paris 3
  • Cécile Fougeron (Directrice de thèse) Directeur de recherche CNRS, LPP, Paris
  • Gaëlle Bruneteau (Co-directrice de thèse) Professeur Universitaire Praticien Hospitalier, Hôpital de la Pitié-Salpêtrière, Paris

Résumé

Distinction entre maladies du motoneurone : les marqueurs acoustiques, révélateurs de profils dysarthriques différents

Cette thèse étudie les apports de l’exploration de la parole dans le diagnostic différentiel entre les trois principales maladies du motoneurone de l’adulte, la sclérose latérale amyotrophique (SLA), la sclérose latérale primitive (SLP) et la maladie de Kennedy (MK). La parole de locuteurs contrôles et de patients présentant ces maladies, a été comparée, au travers de quatre dimensions : la phonation ;  la coordination pneumo-phonatoire ;  la précision articulatoire étudiée sous l’angle acoustique et perceptif ; les aspects temporels dans des tâches de performance et dans la parole continue (lecture et spontané) ; et l’organisation du discours explorée au travers de la durée des continuums de parole et des pauses dans le spontané. Cette thèse met en évidence des marqueurs acoustiques détectant la présence d’une dysarthrie, avec notamment une hypoarticulation retrouvée dans toutes les populations présentant une dysarthrie, et des aspects temporels très perturbés dans les populations SLA et SLP. Par ailleurs, ce travail identifie des marqueurs acoustiques diagnostiques, discriminant les profils dysarthriques entre eux. Le profil dysarthrique des populations SLA et SLP, se distingue clairement de celui de la population MK. Bien que très similaires, nos résultats montrent des différences dans le profil dysarthrique des populations SLA et SLP, soulevant des effets probablement plus importants de la perturbation de la programmation des gestes articulatoires dans la SLP, et de l’instabilité articulatoire dans la SLA. Ce travail ouvre des perspectives d’approfondissement dans la caractérisation de chacun de ces profils dysarthriques.


Distinguishing between motor neuron diseases : acoustic markers reveal different dysarthric profiles

This dissertation studies the contribution of speech exploration to differential diagnosis between the three main motor neuron diseases of adults, amyotrophic lateral sclerosis (ALS), primary lateral sclerosis (PLS) and Kennedy’s disease (KD). The speech of control speakers and of patients with these diseases was compared along four dimensions: phonation; pneumo-phonatory coordination; articulatory precision studied from acoustic and perceptual angles; temporal aspects in performance tasks and in continuous speech (reading and spontaneous); and speech organization explored through the duration of speech continua and pauses in spontaneous speech. This thesis highlights acoustic markers detecting the presence of dysarthria, notably hypoarticulation found in all dysarthric populations, and highly disturbed temporal aspects in the ALS and PLS populations. This study also identifies diagnostic acoustic markers that discriminate between dysarthric profiles. The dysarthric profile of the ALS and PLS populations clearly differs from that of the KD population. Although very similar, our results show differences in the dysarthric profile of the ALS and PLS populations, pointing to the probable greater effects of disrupted programming of articulatory gestures in PLS, and articulatory instability in ALS. This work opens up prospects for further characterization of each of these dysarthric profiles.