Soutenance de Jingyi Sun

La soutenance aura lieu le jeudi 9 juillet 2026 à 10h, à la Maison de la Recherche (4 rue des Irlandais, 75005 Paris), en salle Athéna.

Le jury sera composé de :
  • Mme Cécile Fougeron (présidente du jury), Directrice de Recherche, CNRS
  • Mme Yiya Chen (rapportrice), Professeure, Leiden University
  • M. Jiahong Yuan (rapporteur), Professeur, University of Science and Technology of China
  • Mme Lori Lamel (examinatrice), Directrice de Recherche, CNRS
  • M. Emmanuel Ferragne (examinateur), Professeur, Université Paris Cité
  • Mme Martine Adda-Decker (directrice de thèse), Directrice de Recherche, CNRS
  • Mme Yaru Wu (co-directrice de thèse), Maîtresse de conférences, Université de Caen Normandie
  • M. Nicolas Audibert (invité), Maître de conférences HDR, Université Sorbonne Nouvelle

 

Lorsque le contraste tonal s’effondre : le ton neutre comme système de référence pour quantifier la réduction tonale en mandarin standard

Résumé

Dans la parole continue en mandarin standard, les tons lexicaux restent des catégories phonologiques, mais leur réalisation phonétique en f0 est façonnée par un large éventail de facteurs, parmi lesquels la coarticulation, la durée, la planification prosodique, le style de parole et la fréquence lexicale. Cette situation rend la réduction tonale difficile à isoler de la variation contextuelle générale. Guidée par un dispositif comparatif théoriquement informé et fondée sur de grands corpus oraux, cette thèse traite la réduction comme un mouvement graduel et multidimensionnel sur un continuum allant d’une réalisation forte à une réalisation faible. Elle examine comment les tons lexicaux se rapprochent d’une configuration faible modélisée empiriquement, et à partir de quel point ce rapprochement commence à compromettre le contraste tonal.La référence faible est construite à partir du ton neutre (Neutral Tone, NT), modélisé dans la parole spontanée, lue et radiodiffusée comme une région variable mais régulière de réalisation tonale faible. Le NT est principalement façonné par le ton précédent et la durée, tandis que le style de parole définit un espace de réalisation plus large. Ces régularités permettent de mesurer chaque occurrence de ton lexical par rapport à une trajectoire de NT estimée dans des conditions comparables. La base empirique combine un corpus mandarin de 36 heures construit pour cette thèse et comparant plusieurs styles de parole avec un corpus radiodiffusé du LDC de 30 heures, traités par transcription avec WhisperX, alignement avec MFA, extraction neuronale de la f0 et modélisation acoustique contrôlée. Le système de réduction tonale (Tonal Reduction System, TRS) qui en résulte projette chaque occurrence sur deux Reduction Indices (RIs). RI_shape indexe la géométrie du contour. RI_register indexe le niveau de hauteur et la séparation de l’étendue tonale.

Appliqué aux données de corpus, le TRS identifie la durée comme la contrainte la plus forte. En dessous de 60 ms, plus d’un tiers des occurrences de tons lexicaux en parole spontanée entrent dans une zone à faible contraste, où la forme du contour et le registre se déplacent nettement vers le NT. Lorsque la durée augmente, le contraste se rétablit de manière inégale, la forme continuant à se déployer tandis que la séparation de registre atteint un plateau autour de 120 à 150 ms. L’identité tonale et le contexte tonal structurent également ce mouvement. T1 est le plus proche du NT par la forme de son contour, tout en restant distinct en registre, un résultat compatible avec les analyses antérieures du NT comme cible médiane faiblement implémentée. T3 reste le plus éloigné du NT par son contour, ce qui est cohérent avec sa trajectoire descendante-montante complexe. Les contextes impliquant T2 et T3 résistent à la convergence vers le NT, en particulier pour la forme du contour. Une fois la durée et le contexte contrôlés, la parole spontanée demeure la plus proche de la référence faible, la parole radiodiffusée la plus éloignée, et la parole lue occupe une position intermédiaire. La fréquence lexicale exerce un effet plus faible mais cumulatif, les mots plus fréquents tendant vers des réalisations tonales plus réduites.

Dans l’ensemble, cette thèse définit la réduction tonale comme un mouvement graduel dans un espace contraint d’implémentation phonétique. Elle quantifie dans quelle mesure les tons lexicaux se rapprochent d’une configuration faible ajustée au contexte, dans quelles conditions, et selon quelles dimensions acoustiques. En combinant une modélisation de référence fondée sur le NT avec des indices de réduction compacts, le TRS transforme la réalisation tonale faible, graduelle et sensible au contexte en un objet mesurable, et propose un cadre transférable pour l’étude de la réduction au-delà des tons du mandarin.

Mots-clés : réduction tonale ; ton neutre ; mandarin standard ; phonétique de corpus ; parole continue ; contraste tonal

=================================================

When Tonal Contrast Collapses: Neutral Tone as a Reference System for Quantifying Tonal Reduction in Standard Mandarin

Abstract

In Standard Mandarin connected speech, lexical tones remain phonological categories, yet their surface f0 realization is shaped by a wide range of factors, among them coarticulation, duration, prosodic planning, speech style and lexical frequency. This makes tonal reduction difficult to isolate from general contextual variation. Guided by a theoretically informed comparative design and grounded in large speech corpora, this dissertation treats reduction as a gradient and multidimensional movement along a strong to weak continuum. It asks how lexical tones approach an empirically modeled weak configuration, and when this movement begins to compromise tonal contrast.The weak reference is built from Neutral Tone (NT), modeled across spontaneous, read and broadcast speech as a variable but regular region of weak tonal implementation. NT is shaped chiefly by preceding tone and duration, while style sets the broader realization space. These regularities allow each lexical tone token to be measured against a condition-matched NT trajectory. The empirical base combines a self-built 36-hour style-parallel Mandarin corpus with a 30-hour LDC broadcast news corpus, processed through WhisperX transcription, MFA alignment, neural f0 extraction and controlled acoustic modelling. The resulting Tonal Reduction System (TRS) maps each token onto two Reduction Indices (RIs). RI_shape indexes contour geometry. RI_register indexes pitch level and pitch range separation.

Applied to the corpus data, the TRS identifies duration as the strongest physical constraint. Below 60 ms, more than one third of spontaneous lexical tone tokens enter a low-contrast collapse zone, with both shape and register moving sharply toward NT. As duration increases, contrast recovers unevenly, with shape still unfolding while register separation plateaus around 120 to 150 ms. Tone identity and context further structure this movement. T1 is closest to NT in shape but remains far from it in register, consistent with previous accounts of NT as a weakly implemented static mid target. T3 stays farthest from NT in shape, as expected from its complex falling-rising trajectory. T2 and T3 contexts resist convergence toward NT, especially in shape. After duration and context are controlled, spontaneous speech remains closest to the weak reference, broadcast speech farthest, and read speech intermediate. Lexical frequency adds a smaller cumulative pressure toward lower RI values.

Overall, this dissertation defines tonal reduction as graded movement within a constrained space of phonetic implementation. It quantifies how far lexical tones approach a context-matched weak configuration, under which conditions, and along which acoustic dimensions. By combining NT-based reference modelling with compact RIs, the TRS turns weak, gradient and context-sensitive tonal realization into a measurable object, and offers a transferable framework for studying reduction beyond Mandarin tone.

Keywords : tonal reduction; Neutral Tone; Standard Mandarin; corpus phonetics; connected speech; tonal contrast

Soutenance de Minmin Yang

La soutenance aura lieu le mercredi 24 juin 2026 à partir de 14h, à l’adresse suivante :
Salle Claude Simon, Maison de la Recherche

Université Sorbonne Nouvelle

4 rue des Irlandais, 75005 Paris

 

Le jury sera composé de :
  • Mme Christine Meunier, DR-CNRS (Rapportrice)
  • M. Rudolph Sock, PR-Université de Strasbourg (Rapporteur)
  • Mme Anne Hermes, CR-HDR-CNRS (Examinatrice)
  • M. Pierre Hallé, DR Émérite-CNRS (Examinateur)
  • M. Rachid Ridouane, DR-CNRS (Directeur de thèse)

 

Production des groupes occlusive-liquide en français : Locuteurs natifs et apprenants sinophones
Cette thèse présente une analyse acoustique des groupes consonantiques occlusive-liquides (OL) du français dans deux positions syllabiques : attaque et coda. L’étude compare les productions de 10 locuteurs natifs à celles de 30 apprenants sinophones répartis en trois niveaux de compétence (M1, M2 et M3). Deux contextes prosodiques sont examinés : mots isolés et mots insérés dans une phrase porteuse. La recherche s’appuie sur une différence phonotactique fondamentale entre les deux langues : alors que le mandarin ne permet pas de groupes consonantiques en attaque et en coda, le français les autorise de manière productive. Cette divergence rend les groupes OL particulièrement pertinents pour étudier l’acquisition d’une autre langue et l’implémentation acoustique des clusters consonantiques. À partir d’un ensemble de mesures segmentales et suprasegmentales, incluant les patrons de modification des clusters, la fréquence et les propriétés acoustiques du schwa, les patrons de voisement consonantique, la durée du relâchement des occlusives, ainsi que les ajustements des voyelles adjacentes, cette thèse analyse à la fois les cibles de production des locuteurs natifs et les trajectoires d’apprentissage des apprenants.
Dans les deux contextes étudiés, l’output acoustique est fortement influencé par la position du cluster et le type de liquide : les codas subissent plus fréquemment des modifications que les attaques, tandis que les clusters contenant une rhotique apparaissent plus affectés que ceux avec une latérale. Le dévoisement et l’insertion de schwa constituent les principaux types de modification. En particulier, les séquences sourdes+rhotiques montrent un dévoisement quasi catégoriel de la rhotique, alors que les latérales présentent plus souvent un dévoisement partiel. Une asymétrie parallèle est observée pour le schwa : il est particulièrement fréquent dans les voisées+rhotiques, et relativement moins fréquent dans les clusters avec latérale. Les résultats sur le schwa étayent une analyse à double origine en français natif : entre consonnes, il a les caractéristiques d’un vocoïde transitionnel façonné par le contexte segmental, tandis qu’en position finale, il est lié à un conditionnement phonologique ou prosodique et augmente dans la phrase porteuse. Les apprenants s’écartent des natifs par une moindre stabilité laryngale et un schwa plus fréquent : ils insèrent davantage de schwa et maintiennent rarement un voisement continu sur les deux consonnes dans les groupes à occlusive voisée, avec des effets du voisement sur les voyelles adjacentes plus faibles, voire absents.
Globalement, les résultats suggèrent que de nombreuses pressions qui conditionnent la réalisation des groupes OL sont partagées entre natifs et apprenants, tandis que la variabilité persistante chez ces derniers reflète la difficulté d’acquérir la coordination temporelle et laryngée propre aux groupes consonantiques, sous l’effet des contraintes phonotactiques de la L1.
Mots-clés : Suites occlusive-liquide, acoustique, natifs français, apprenants chinois, onset-coda, stratégies de réparation, contraintes phonotactiques, schwa.
 
 
——————————————————————————————
 
Production of French stop-liquid clusters: Native speakers and Mandarin learners
This thesis provides an acoustic study of French stop-liquid (SL) clusters in onset and coda position, comparing 10 native French speakers with 30 Mandarin-speaking learners at three proficiency levels (M1, M2, and M3), and testing two prosodic contexts: words in isolation vs. words within a carrier sentence. The study is motivated by a major phonotactic mismatch: Mandarin lacks complex consonant clusters in both onsets and codas, whereas French productively licenses them, making SL clusters a particularly informative case for L2 acquisition and phonetic implementation. Using a set of segmental and suprasegmental measures – cluster modification patterns (including devoicing and schwa-like vocoids), schwa frequency and acoustic properties (duration and formants), consonantal voicing ratios, stop release duration proportion, and vowel adjustments adjacent to clusters (preceding-vowel duration in codas; vowel onset F0 after onsets) – the thesis characterizes both native targets and learner trajectories.
Across contexts, cluster position and liquid type robustly conditioned production: codas were more often modified than onsets, and rhotic clusters were patterned as more “difficult” than lateral clusters. Devoicing and schwa insertion emerged as the principal modification types. In particular, voiceless stop+rhotic sequences showed consistent, near-categorical devoicing of the rhotic, whereas laterals in comparable contexts were more likely to exhibit only partial devoicing. A parallel asymmetry emerged for schwa: schwa-like vocoids were especially frequent in voiced stop+rhotic clusters and were comparatively less frequent in lateral clusters. Schwa results support a dual-source account in native speech: cluster-internal schwa behaves like a transitional vocoid shaped by segmental context (including liquid-driven effects on F2/F3), whereas word-final schwa is more strongly linked to phonological/prosodic conditioning and increases in the carrier-sentence context. Learners diverged most clearly in laryngeal stability and schwa behavior: they inserted schwa more frequently (especially word-finally) and rarely maintained full voicing across both consonants in voiced clusters, with weaker or absent voicing-related effects on adjacent vowels compared to natives.
Overall, the findings argue that many conditioning pressures on SL clusters are shared across native and learner speech, while persistent learner variability reflects the difficulty of acquiring cluster-level timing and voicing coordination under strong L1 phonotactic constraints.
Keywords: Stop-liquid clusters, acoustics, French natives, Chinese learners, onset-coda, repair strategies, phonotactic constraints, schwa.

Soutenance d’Andrés Lara

La soutenance aura lieu le mardi 16 juin 2026 à 14h, à la Maison de la Recherche (4 rue des Irlandais, 75005 Paris), en Salle Athéna.

Il sera également possible de suivre la soutenance à distance via le lien suivant :
https://rendez-vous.renater.fr/muted/Soutenance_de_these_dbef01-5e60b5-6d0c29#config.startWithVideoMuted=true&config.startWithAudioMuted=true

Le jury est composé de :

  • Mme Nathalie Vallée (Présidente du jury), Directrice de Recherche, CNRS
  • M. Jeffrey Steele (Rapporteur), Professeur, Université de Toronto Mississauga
  • M. Hans Van de Velde (Rapporteur), Professeur, Université d’Utrecht
  • Mme Anne Hermes (Examinatrice), Chargée de Recherche, CNRS
  • M. Didier Demolin (Examinateur), Professeur Émérite, Université Sorbonne Nouvelle
  • M. Emmanuel Ferragne (Examinateur), Professeur, Université Paris Cité
  • Mme Claire Pillot-Loiseau (Directrice de thèse), Professeur, Université Sorbonne Nouvelle

 

Résumé

Les rhotiques forment une catégorie phonologique cohérente dans de nombreuses langues, en dépit de leur hétérogénéité phonétique. Cette thèse examine deux systèmes rhotiques aux propriétés contrastées, le /ʁ/ français et le /ɹ/ de l’anglais américain, et montre que la même catégorie phonologique rhotique peut être réalisée par des stratégies de codage diamétralement opposées : l’une acoustique et contextuellement organisée, l’autre articulatoire et individuellement stabilisée.

Pour le /ʁ/ français, un modèle de classification par forêts aléatoires entraîné sur le signal acoustique identifie le voisement et le mode d’articulation avec 95,4 % et 96,5 % de précision en validation croisée stratifiée. Des modèles bayésiens hiérarchiques révèlent que le voisement est principalement conditionné par le contexte segmental adjacent et la position de coda. Le contraste fricative-approximante est organisé par l’assimilation du voisement des obstruantes adjacentes. Le contraste vibrante-approximante est, en revanche, insensible au contexte segmental et régi par les stratégies articulatoires individuelles des locuteurs. La validation articulatoire par EMA confirme partiellement ces catégories : le mode d’articulation présente des corrélats articulatoires crédibles, mais le voisement n’en présente aucun, sa variabilité articulatoire étant absorbée par les effets de locuteur.

Pour le /ɹ/ américain, une classification non supervisée des indices articulatoires EMA, précédée d’une évaluation diagnostique explicite du nombre de groupes, partitionne l’espace en trois configurations (rétroflexe, bunched, intermédiaire). Ces diagnostics révèlent que cet espace est structuré de façon continue plutôt que discrètement regroupé, corroborant le continuum articulatoire documenté depuis Delattre et Freeman (1968). La sélection de configuration est dominée par l’identité du locuteur. La classification acoustique plafonne à 65,4 % de précision, avec un rappel qui s’effondre à 48,6 % pour la rétroflexe, résultat cohérent avec le principe d’équivalence motrice, qui rend l’inversion acoustique-vers-articulatoire structurellement contrainte pour ce système.

Ces résultats définissent deux modalités contrastées de correspondance acoustique-articulatoire. Pour le /ʁ/ français, l’information acoustique suffit à identifier la catégorie de mode, et cette catégorie présente des corrélats articulatoires identifiables : l’inversion acoustique-vers-articulatoire est déterminable. Pour le /ɹ/ américain, cette inversion est structurellement sous-déterminée : une même signature acoustique peut être produite par au moins trois configurations articulatoires distinctes, et l’information acoustique seule ne permet pas d’identifier la réalisation sous-jacente.

Mots-clés : rhotiques, classification automatique, articulographie électromagnétique (EMA), modèles bayésiens hiérarchiques, phonétique acoustique, phonétique articulatoire

Abstract

Rhotics form a coherent phonological category in many languages, despite their phonetic heterogeneity. This thesis examines two rhotic systems with contrasting properties, French /ʁ/ and American English /ɹ/, and shows that the same rhotic phonological category can be realized through diametrically opposed coding strategies: one acoustic and contextually organized, the other articulatory and individually stabilized.

For French /ʁ/, a random forest classifier trained on the acoustic signal identifies voicing and manner of articulation with 95.4% and 96.5% accuracy in stratified cross-validation. Hierarchical Bayesian models reveal that voicing is primarily conditioned by adjacent segmental context and coda position. The fricative-approximant contrast is organized by voicing assimilation from adjacent obstruents. The trill-approximant contrast, by contrast, is insensitive to segmental context and governed by individual speakers’ articulatory strategies. EMA articulatory validation partially confirms these categories: manner of articulation yields credible articulatory correlates, whereas voicing yields none, its articulatory variability being absorbed by speaker effects.

For American English /ɹ/, an unsupervised classification of EMA articulatory indices, preceded by explicit diagnostic evaluation of the number of clusters, partitions the articulatory space into three configurations (retroflex, bunched, intermediate). These diagnostics reveal that the space is structured continuously rather than discretely clustered, corroborating the articulatory continuum documented since Delattre and Freeman (1968). Configuration selection is dominated by speaker identity. Acoustic classification peaks at 65.4% accuracy, with recall collapsing to 48.6% for the retroflex, a result consistent with the motor equivalence principle, which renders acoustic-to-articulatory inversion structurally constrained for this system.

These results characterize two contrasting modes of acoustic-articulatory correspondence. For French /ʁ/, acoustic information is sufficient to recover the manner category, and that category has identifiable articulatory correlates: the acoustic-to-articulatory mapping is recoverable. For American English /ɹ/, the mapping is structurally indeterminate: the same acoustic signature can be produced by at least three distinct articulatory configurations, and acoustic information alone cannot identify the underlying realization.

Keywords: rhotics, automatic classification, electromagnetic articulography (EMA), hierarchical Bayesian models, acoustic phonetics, articulatory phonetics

Soutenance de Xuejing Chen

La soutenance aura lieu le 09 avril 2026 à 14h30, à l’adresse suivante :

Salle Athéna
Maison de la recherche
4, rue des Irlandais
75005 Paris

Le jury sera composé de :

  • M. Rachid Ridouane, DR-CNRS (Directeur de thèse)
  • Mme Ioana Chitoran, PR-UniversitéParis Cité(Présidente)
  • Mme Michela Russo, PR-UniversitéParis 8 (Rapportrice)
  • Mme Sophie Dufour, DR-CNRS (Rapportrice)
  • Mme Shigeko Shinohara, CR-CNRS (Examinatrice)
  • M. Pierre Hallé, DR Émérite-CNRS (Examinateur)

Perception et production des clusters en position initiale par des sinophones

Cette thèse examine les difficultés dans la perception et la production des clusters consonantiques non-natifs chez les sinophones. Elle s’inscrit dans une double démarche expérimentale et théorique visant à comprendre comment le Principe de Sonorité Séquentielle (PSS) et d’autres facteurs comme la coordination articulatoire ou le Principe du Contour Obligatoire (OCP), contribuent à ces difficultés. Les expériences de perception montrent que la perception d’un schwa dans les CCa du tachlhit et les difficultés sinophones à discriminer CCa-CəCa augmentent avec la marque de CC selon le PSS, suggérant une insertion perceptive de schwa modulée par le PSS. Les expériences de production, menées avec les mêmes participants et les mêmes stimuli, montrent qu’il y a une insertion de schwa spécifique àla production elle aussi guidée par le PSS. De plus, la nature du schwa inséré dépend de la perception ou pas d’une voyelle dans les CC. Par ailleurs, ces expériences relèvent une difficulté particulière pour /tl/, où les sinophones substituent /t/ à /k/, un phénomène interprétécomme un shift dental-vélaire. Ce résultat a conduit à mettre en place deux tâches de discrimination ciblant la perception des clusters dentale+/l/ chez les sinophones et les francophones. Les résultats montrent que ce shift est systématique chez les sinophones, mais ne se manifeste chez les francophones qu’en position initiale de mot. Ces résultats convergent vers l’idée que les difficultés en perception et production des clusters résultent d’interactions entre des contraintes phonologiques (PSS, OCP) et des principes phonétiques sur la coordination gestuelle, plutôt que d’un seul facteur.

Mots-clés : Principe de SonoritéSéquentielle ; production et perception des clusters ; réparation phonotactique ; shift dental-vélaire ; mandarin chinois ; tachlhit ; français Perception and production of onset consonant clusters by Mandarin Chinese Speakers

This dissertation examines the difficulties encountered by Chinese speakers in the perception and production of nonnative consonant clusters. It takes both an experimental and a theoretical approach to understand how the Sonority Sequencing Principle (SSP) and other factors, such as articulatory coordination and the Obligatory Contour Principle (OCP), contribute to these difficulties. Perception experiments show that the perceptual epenthesis of schwa in Tashlhiyt CCa sequences, as well as Chinese listeners’ difficulty in discriminating CCa-CəCa, increase with the CC markedness according to SSP, suggesting that schwa epenthesis is modulated by this principle. Production experiments, conducted with the same participants and the same stimuli, reveal a production-specific schwa insertion that is also guided by the SSP. Moreover, the nature of the inserted schwa depends on whether a vowel is perceived within the cluster. These experiments also reveal a particular difficulty with /tl/, in which Chinese speakers substitute /t/ with /k/, a phenomenon interpreted as a dental-velar shift. This finding called for two discrimination tests targeting the perception of dental+/l/ clusters among Chinese and French listeners. The results show that this shift is systematic among Chinese speakers but only occurs in word-initial position among French speakers. Taken together, these findings suggest that difficulties in the perception and production of clusters arise from interactions between phonological constraints (SSP, OCP) and phonetic principles of gestural coordination, rather than from a single factor.

Keywords: Sonority Sequencing Principle; cluster production and perception; phonotactic repair; dental-to-velar shift; Mandarin Chinese; Tashlhiyt; French

Soutenance de Thèse de Wenxun Fu

La soutenance aura lieu le 28 novembre 2025 à 14h, à l’adresse suivante :
Salle de conférence au RdC,
Centre Culturel Irlandais (en face de la maison de la recherche)

5, rue des Irlandais
75005 Paris

Le jury sera composé de :
  • Mme Martine Adda-Decker, DR-Université Sorbonne Nouvelle (Directrice de thèse)
  • Mme Barbara Kühnert, MDC-Université Sorbonne Nouvelle (Directrice de thèse)
  • Mme Claire Pillot-Loiseau, PR- Université Sorbonne Nouvelle (Présidente)
  • M. Fabian Santiago, MDC, HDR- Université Paris 8 (Rapporteur)
  • Mme Ioana Vasilescu, DR-Université Paris-Saclay (Rapportrice)
  • Yaru Wu, MDC- Université de Caen Normandie (Examinatrice)

 

L’accent mandarin en français: caractérisation et remédiation

La qualité de l’accent étranger est fortement influencée par la langue maternelle, ce qui rend essentiel, dans l’enseignement des langues, de cibler les sons absents ou différents de la L1. Or, une prononciation précise dépasse les mots isolés : la parole naturelle inclut réductions et variations liées au style, au contexte et aux facteurs sociaux. Alors que les natifs gèrent ces changements spontanément, les apprenants L2 peinent souvent à le faire. Cette étude analyse les difficultés segmentales de locuteurs mandarin apprenant le français lors de lecture de mots, de lecture de texte et de conversation spontanée. Plus de sept heures d’enregistrements de 20 apprenants et 10 natifs révèlent plusieurs traits : voyelles arrondies moins marquées, voyelles nasales souvent confondues, réalisation de /ɥi/ avec transition insuffisante proche de /y/, et fricatives voisées fréquemment dévoisées, surtout en position finale. Les principales différences concernent la réduction vocalique et le voisement des fricatives lorsque la parole devient plus continue. Sur cette base, nous avons conçu un programme extrascolaire de formation à la prononciation utilisant des enregistrements de natifs. Trente-six apprenants du français en Chine ont suivi quatre semaines d’imitation ou de shadowing. Les posttests montrent des progrès significatifs en perception et production des fricatives voisées et de /ɥi/. Les débutants progressent davantage avec l’imitation, les intermédiaires avec le shadowing, soulignant l’importance d’adapter les méthodes au niveau. Les mots en contexte s’améliorent moins que les mots isolés, confirmant que la parole continue requiert une attention pédagogique accrue.

 

Mots clés : Français langue étrangère (FLE), acquisition en L2 dans différents styles oraux, shadowing, imitation en apprentissage de langues, apprentissage autonome à la prononciation, accent du français chez les apprenants mandarins

_________________________________________________________

The Mandarin accent in French: characterization and remediation

Foreign accent quality is strongly influenced by learners’ native language, making it crucial for L2 instruction to target sounds absent from, or different in, the L1. Yet accurate pronunciation extends beyond isolated words: natural speech includes reduction and variation shaped by style, context, and social factors. While native speakers manage these shifts naturally, L2 learners often struggle. This study examines segmental difficulties among Mandarin learners of French across isolated word reading, text reading, and spontaneous conversation. Over seven hours of data from 20 learners and 10 natives revealed key features of Mandarin-accented French: rounded vowels are less rounded than native speech; nasal vowels, absent from Mandarin, are frequently confused; /ɥi/ is produced with insufficient transition, approaching /y/; and voiced fricatives, also largely absent, are often devoiced, particularly in word-final position. The main differences between natives and learners as style shifted to more continuous speech lay in the amount of vowel reduction and the degree of fricative voicing. Based on these findings, we designed an extracurricular training program using native recordings. Thirty-six Mandarin learners of French at BLCU completed four weeks of imitation or shadowing. Post-tests showed significant gains in perception and production of voiced fricatives and /ɥi/, while progress of nasal vowels remained inconclusive. Beginners improved most with imitation, intermediates with shadowing—highlighting the need to adapt methods to proficiency. Words in sentences improved less than isolated words, confirming that continuous speech requires greater pedagogical focus.

Keywords: French as a foreign language (FFL), L2 acquisition in different speaking styles, shadowing technique, imitation in language learning, autonomous pronunciation learning, French accent of Mandarin speakers

Soutenance de Thèse de Lei Xi

La soutenance aura lieu le Jeudi 26 Juin 2025 à 9h30, au lieu suivant :

Salle Athéna, Maison de la Recherche, Université Sorbonne Nouvelle
4 Rue des Irlandais, 75005 Paris.

Devant un jury composé de :

  • Mme Elisabeth DELAIS-ROUSSARIE, DR – CNRS (rapportrice)
  • M. Frederic ISEL, PR – Université Paris Nanterre (examinateur)
  • Mme Sharon PEPERKAMP, DR – CNRS (rapportrice)
  • Mme Claire PILLOT-LOISEAU, PR – Université Sorbonne Nouvelle (examinatrice)
  • M. Rachid RIDOUANE, DR – CNRS (directeur de thèse)

———————————-Résumé ——————————————-

L’acquisition de la prosodie du français par des apprenants sinophones : Études acoustique, perceptive et électroencéphalographique

Bien que centrale dans la communication parlée, la prosodie reste un domaine moins exploré dans les travaux de recherche sur l’acquisition des langues secondes. Cette thèse traite de la segmentation et de l’organisation prosodiques en français chez des locuteurs natifs francophones et des apprenants sinophones de trois niveaux (débutants, intermédiaires, avancés).

La prosodie assume notamment deux rôles clés : délimiter les unités syntaxiques et structurer le flux temporel-rythmique. Le mandarin, utilisant des tons lexicaux, mobilise différemment ces éléments, comparé au français. Notre recherche cherche à montrer comment les apprenants sinophones acquièrent la prosodie française pour traiter des ambiguïtés syntaxiques locales, illustrées par des phrases à clôture précoce (CP : « Chaque fois que le serpent mangeait, le rat se cachait. ») ou tardive (CT : « Chaque fois que le serpent mangeait le rat, le lapin se cachait. »). Pour cela, des données acoustiques (31 locuteurs : 10 natifs, 21 apprenants), perceptives (60 auditeurs : 20 natifs, 40 apprenants) et électroencéphalographiques (60 participants : 20 natifs, 40 apprenants) ont été analysées, totalisant 151 individus.

Les résultats acoustiques révèlent que dès le niveau intermédiaire, les apprenants utilisent la montée du F0 et l’allongement final pour signaler les frontières CP et CT. Concernant l’organisation prosodique, les valeurs de neuf paramètres quantitatifs (%V, ΔC et ∆V, VarcoV et VarcoC, nPVI-V et rPVI-C, CCI-C et CCI-V) ont révélé une même tendance dans l’évolution du patron rythmique : il devient de plus en plus stable à mesure que le niveau de français progresse. Sur le plan perceptif, les apprenants (et, dans une moindre mesure, les natifs) rencontrent des difficultés accrues avec les structures complexes comme la CP. Les données EEG montrent que les frontières CP et CT activent une closure positive shift (CPS) chez tous les groupes, confirmant leur traitement neurocognitif. Une neuroplasticité est suggérée par les variations topographiques des CPS entre natifs et apprenants durant le traitement de la CP. La ramp-like negativity, observée pour la CT, reflète un processus top-down chez les natifs contre un mécanisme bottom-up chez les apprenants lors de l’analyse des indices acoustiques.

En conclusion, cette recherche contribue à la compréhension de l’acquisition prosodique en L2 et met en lumière les différences comportementale et neurocognitive dans le traitement des frontières prosodiques localement ambiguës entre natifs et apprenants.

Mots clés : français, chinois mandarin, prosodie, frontière prosodique, acquisition, acoustique, perception, EEG, potentiel évoqué, CPS

———————————-Abstract——————————————-

Acquisition of French prosody by Chinese learners: acoustic, perceptive and electroencephalographic studies

Despite its central role in spoken communication, prosody remains a less explored area in second language acquisition research. This thesis investigates performance of French prosodic segmentation and organization in native speakers and Chinese L2 learners across three proficiency levels: beginner, intermediate, and advanced.

Prosody serves two primary functions in language, namely, delimiting syntactic units and regulating the temporal flow of speech. Mandarin, using lexical tones, mobilizes prosodic features differently from French. This thesis aims to investigate how Chinese L2 learners acquire French prosody to deal with local syntactic ambiguities, as exemplified by sentences exhibiting early closure (EC: « Chaque fois que le serpent mangeait, le rat se cachait. », “Whenever the snake was eating, the rat would hide. ») and late closure (LC: « Chaque fois que le serpent mangeait le rat, le lapin se cachait. », « Whenever the snake was eating the rat, the rabbit would hide. »). The analysis involved acoustic (31 subjects: 10 natives, 21 learners), perceptual (60 participants: 20 natives, 40 learners), and electroencephalographic (60 participants: 20 natives, 40 learners) data, encompassing a total of 151 individuals.

The acoustic results reveal that learners employ F0 rising and final lengthening to signal EC and LC boundaries from the intermediate level onward. In terms of prosodic organization, nine rhythm metrics (%V, ΔC and ΔV, VarcoV and VarcoC, nPVI-V and rPVI-C, CCI-C and CCI-V) show a consistent trend in rhythmic pattern development: it becomes increasingly more stable as proficiency in French advances. Perceptually, learners (and to a lesser extent, natives) encounter challenges with complex structures like EC. The EEG data indicate that both EC and LC boundaries elicited a closure positive shift (CPS) across all participant groups, underscoring their neurocognitive processing. Neuroplasticity is implied by the distinct topography of CPS between natives and learners during EC processing. The ramp-like negativity observed in LC condition reflects a top-down process in natives versus a bottom-up mechanism in learners when deciphering prosodic cues.

In summary, this thesis enhances our comprehension of L2 prosodic acquisition and provides novel perspectives on the behavioral and neurocognitive differences in the interpretation of local ambiguous prosodic boundaries between native French speakers and Chinese L2 learners.

Keywords: French, Mandarin Chinese, prosody, prosodic boundary, acquisition, acoustics, perception, EEG, ERP, CPS

Soutenance de Thèse de Clémence Guieu-Grandsire

La soutenance aura lieu le 19 Mars 2025 à 14h, au lieu suivant :

Université Sorbonne Nouvelle – Paris 3
Campus Nation – Salle A608 (Bâtiment A – 6ème étage)
8 avenue de Saint Mandé, 75012 Paris

Devant un jury composé de :

  • Sophie WAUQUIER, Professeure des universités – Université Paris 8 (examinatrice)
  • Yvan ROSE, Professeur des universités – Memorial University of Newfoundland (rapporteur)
  • Evgenia MAGOULA, Professeure des universités – National and Kapodistrian University of Athens (rapportrice)
  • Letícia ALMEIDA, Professora Auxiliar – Universidade de Lisboa (examinatrice)
  • Shigeko SHINOHARA, Chargée de Recherche Hors Classe HDR – CNRS (directrice de thèse)
  • Naomi YAMAGUCHI, Maîtresse de Conférences – Université Sorbonne Nouvelle (co-directrice de thèse)

Il sera également possible d’y assister à distance par Zoom, un lien vous sera communiqué ultérieurement. La présentation aura lieu en français.

À l’issue de la soutenance, un pot suivra en salle A609.

———————————-Résumé ——————————————-
Cette thèse explore, à travers une étude semi-longitudinale, l’acquisition phonologique segmentale et syllabique chez des enfants bilingues et monolingues franco-grecs en se concentrant spécifiquement sur l’acquisition des rhotiques /ʁ/ et /ɾ/ et sur les clusters Obstruante + Liquide (OL) en perception et en production.
Des données ont été collectées trois fois tous les six mois auprès de 26 enfants au développement typiques âgés de 2 ;8 à 6 ;2 : huit monolingues francophones, sept monolingues hellénophones, et onze bilingues franco-grecs, dont six vivant en France et cinq en Grèce. Pour examiner précisément l’influence de l’input sur le développement phonologique bilingue, nous avons catégorisé les profils d’input individuels reçu par les onze enfants bilingues de notre étude à partir d’une combinaison de données naturelles sur l’environnement linguistique familial (recueillies avec le dispositif LENA) et des données estimées sur l’environnement linguistique extra-familial (recueillies avec des questionnaires parentaux). Cette méthodologie novatrice a permis de comparer le développement phonologique des bilingues selon le profil d’input reçu (dominant en français, équilibré ou dominant en grec) avec celui des monolingues dans chaque langue.
Nos résultats montrent que les bilingues développent des systèmes phonologiques globalement similaires à ceux des monolingues, avec certaines interactions spécifiques entre les systèmes, liées à la fois au statut bilingue et modulée par le profil de l’input reçu dans chaque langue. Par exemple, tous les enfants acquièrent /ʁ/ avant /ɾ/ mais les bilingues dont l’input est dominant en français montrent un délai important dans l’acquisition de /ɾ/ et des clusters spécifiques au grec comme /ɣɾ/ et /ɣl/ comparés aux monolingues hellénophones et aux bilingues dont l’input est dominant en grec. Ce délai s’accompagne également d’un transfert temporaire où /ɾ/ est substitué par [ʁ] mais uniquement chez les bilingues dont l’input est dominant en français ou équilibré. À l’inverse, les structures syllabiques partagées comme les occlusive + latérale en français, le constituant coda interne ou la structure OL en grec sont acquis plus tôt chez les bilingues que chez les monolingues.
Pour rendre compte de ces interactions, nous proposons un modèle intégratif de l’acquisition phonologique bilingue montrant que le profil de l’input influence principalement l’acquisition des propriétés complexes spécifiques à chaque langue. Ce modèle suggère que l’enfant bilingue recevant un input « non-dominant » dans la langue contenant la propriété complexe pourra acquérir plus tardivement cette propriété comparé à ses pairs monolingues ou bilingues recevant un input dominant dans cette langue, surtout lorsqu’il existe une propriété moins complexe acquise dans l’autre langue.
Cette recherche enrichit les modèles théoriques proposés pour rendre compte de l’acquisition phonologique, en élargissant leur application à des contextes bilingues peu étudiés. Elle clarifie également le rôle de l’input sur l’acquisition bilingue en mettant en évidence une influence limitée aux propriétés spécifiques complexes. Elle souligne ainsi l’importance d’une approche interactive des facteurs internes et externes à la langue dans le développement phonologique bilingue.

———————————-Abstract——————————————-
This dissertation investigates, through a semi-longitudinal study, the segmental and syllabic phonological acquisition in bilingual and monolingual French-Greek children, with a specific focus on the acquisition of the rhotics /ʁ/ and /ɾ/ and Obstruent + Liquid (OL) clusters in both perception and production.
Data were collected three times at six-month intervals from 26 typically developing children aged 2;8 to 6;2: eight monolingual French-speaking children, seven monolingual Greek-speaking children, and eleven bilingual French-Greek children, six living in France and five in Greece. To precisely examine the influence of input on bilingual phonological development, we categorized the input profiles of the eleven bilingual children based on a combination of naturalistic data on their home linguistic environment (collected using the LENA system) and estimated data on their extra-familial linguistic exposure (gathered through parental questionnaires). This innovative methodology allowed us to compare bilingual phonological development according to input profiles (French-dominant, balanced, or Greek-dominant) with that of monolinguals in each language.
Our results show that bilingual children develop phonological systems broadly similar to those of monolinguals, with specific interactions between the two systems influenced both by bilingual status and modulated by the input profile in each language. For instance, all children acquired /ʁ/ before /ɾ/, but bilinguals with a French-dominant input profile exhibited a significant delay in acquiring /ɾ/ and Greek-specific clusters such as /ɣɾ/ and /ɣl/ compared to monolingual Greek-speaking children and bilinguals with a Greek-dominant input profile. This delay was also accompanied by a temporary transfer phenomenon, where /ɾ/ was substituted by [ʁ], but only in bilinguals with a French-dominant or balanced input profile. Conversely, shared syllabic structures, such as plosive + lateral in French, the internal coda constituent or OL structure in Greek, were acquired earlier by bilinguals than by monolinguals.
To account for these interactions, we propose an integrative model of bilingual phonological acquisition, demonstrating that input profiles primarily influence the acquisition of complex properties specific to each language. This model suggests that a bilingual child receiving « non-dominant » input in the language containing the complex property may acquire it later than their monolingual or bilingual peers receiving dominant input in that language, particularly when a less complex equivalent property is acquired in the other language.
This research contributes to theoretical models of phonological acquisition by extending their application to underexplored bilingual contexts. It also clarifies the role of input in bilingual acquisition, highlighting its influence as being limited to language-specific complex properties. Ultimately, this study underscores the importance of an interactive approach to internal and external linguistic factors in bilingual phonological development.

Soutenance de Thèse de Philipp Buech

La soutenance aura lieu le Vendredi 31 janvier 2025 à partir de 9h30, au lieu suivant :

Maison de la Recherche
Université Sorbonne Nouvelle
Salle du Conseil
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Nicolas AUDIBERT, MCF – Université Sorbonne Nouvelle (examinateur)
  • Ioana CHITORAN, PR – Université Paris Cité (examinatrice)
  • Alexei KOCHETOV, PR – University of Toronto (rapporteur)
  • Ian MADDIESON, PR Emeritus – University of New Mexico (examinateur)
  • Chakir ZEROUAL, PR – Université Mohamed 1er – Oujda (rapporteur)
  • Rachid RIDOUANE, DR – CNRS (directeur de thèse)
  • Anne HERMES, CRCN – CNRS (co-directrice de thèse)

 

Articulations secondaires en tachlhit : Articulation et acoustique de la labialisation et de la pharyngalisation

Les articulations secondaires sont des constrictions de moindre degré superposées à une autre constriction primaire plus forte, principalement signalées sur les voyelles environnantes. Le tachlhit, une langue amazighe parlée au Maroc, fait partie des rares langues qui possèdent deux articulations secondaires : la labialisation dans l’ensemble des dorsales et la pharyngalisation dans l’ensemble des coronales. Ces contrastes n’ont pas encore été explorés phonétiquement dans cette langue. Le tachlhit se distingue également par sa forte utilisation de séquences de consonnes, où l’on peut trouver des consonnes avec des articulations secondaires. La question se pose de savoir comment ces articulations se manifestent phonétiquement lorsque l’environnement immédiat du segment pharyngalisé ou labialisé est partiellement ou entièrement occupé par des consonnes.
Cette thèse vise à analyser les caractéristiques articulatoires et acoustiques de la labialisation et de la pharyngalisation en tachlhit dans les productions de logatomes et dans les productions de mots contenant diverses séquences. Les données articulatoires recueillies par EMA auprès de six locuteurs, ainsi que les données acoustiques recueillies auprès de 35 locuteurs ont été analysées. Les résultats montrent des mécanismes articulatoires distincts pour les deux contrastes, mais qui ciblent tous les deux le formant F2 dans les voyelles environnantes en tant que corrélat acoustique primaire. En outre, la labialisation se limite aux segments immédiatement adjacents, tandis que la pharyngalisation s’étend à des domaines plus vastes. Les résultats sont utilisés pour éclairer la représentation phonologique de ces articulations secondaires.

 

Secondary articulations in Tashlhiyt: Articulation and acoustics of labialization and pharyngealization

Secondary articulations are constrictions of a lesser degree superimposed on another stronger primary constriction, mostly signaled on surrounding vowels. Tashlhiyt, an Amazigh language spoken in Morocco, is one of the rare languages with two contrastive secondary articulations. These are labialization in the set of dorsals and pharyngealization in the set of coronals, two contrasts that have not yet been explored phonetically in this language. Tashlhiyt is also notable for its strong use of consonant sequences, where consonants with secondary articulations can occur. The question arises as to how these secondary articulations are phonetically manifested when consonants partly or entirely occupy the immediate segment environment.

This thesis aims to analyze the articulatory and acoustic characteristics of labialization and pharyngealization in Tashlhiyt in logatome productions and word productions containing diverse sequences. For this investigation, articulatory data collected via electromagnetic articulography (EMA) from six speakers, as well as acoustic data collected from 35 speakers, were analyzed.
The results show distinct articulatory mechanisms for labialization and pharyngealization that both target the F2 formant in surrounding vowels as the primary acoustic correlate. In addition, labialization is restricted only to immediately adjacent segments, while pharyngealization extends into larger domains. The findings are used to inform the phonological representation of these secondary articulations.

 

Soutenance de Thèse de Boram Lee

La soutenance aura lieu le jeudi 5 décembre à 15h00 à l’adresse suivante :

Université Sorbonne Nouvelle – Paris 3
Campus Nation – Salle A608
8 avenue de Saint Mandé, 75012 Paris

 

Devant le jury composé de :

  • Jeffrey STEELE (Rapporteur), PU, University of Toronto
  • Marc DUVAL (Rapporteur), MCF(HDR), Sorbonne Université
  • Claire PILLOT-LOISEAU (Examinatrice), PU, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle
  • Jiyoung CHOI (Examinatrice), MCF, INALCO
  • Cécile Fougeron (Directrice), DR, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle
  • Naomi YAMAGUCHI (Co-directrice), MCF, LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle

 

Résumé
Cette thèse explore l’acquisition du contraste laryngal coréen à 3 catégories (lenis, fortis, aspirée) par 21 apprenantes francophones sur un an.
En perception, une tâche d’identification sur des stimuli naturels (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) révèle des difficultés avec la lenis, alors que l’aspirée et la fortis s’améliorent. L’analyse des poids relatifs du VOT et de la f0 sur stimuli synthétisés (/t/, /tʰ/, /t*/) montre des différences avec les coréanophones (KR) : 1) poids plus important du VOT pour aspirée vs fortis (comme KR) ; 2) poids plus important sur la f0 pour fortis vs lenis (KR: poids équivalents de deux indices) ; 3) poids similaires de deux indices pour aspirée vs lenis (KR: f0 plus importante).
En production, la tâche de répétition (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) montre une distinction du VOT (fortis vs aspirées et lenis), et de la f0 (lenis vs aspirées et fortis), avec des poids relatifs similaires aux KR. Cependant, la tâche de lecture diffère : la lenis produite avec un VOT court. Les poids relatifs du VOT et de la f0 varient entre occlusives (OCC) et affriquées (AFF), sauf pour aspirée vs fortis (VOT plus important) : pour fortis vs lenis, poids similaires de deux indices (OCC), poids supérieur sur la f0 (AFF) ; pour lenis vs aspirée, poids supérieur sur le VOT (OCC), poids similaires de deux indices (AFF).
La perception précède généralement la production, avec une variabilité persistante, mais une influence mutuelle complexe existe. L’acquisition phonétique complète nécessite plus d’un an. Cependant, la réorganisation en 3 catégories et l’intégration de la f0 sont acquises, montrant une réussite phonologique avant la maîtrise phonétique.
Abstract
Korean three-way laryngeal contrast (lenis, fortis, aspirated) employs both VOT and f0, unlike French binary laryngeal contrasts realized solely by VOT. This study explores the acquisition of the three- way laryngeal contrast by 21 French learners over one year.
In perception, the results reveal persistent difficulties with lenis identification, while aspirated and fortis improved over time. Cue weighting of VOT and f0 showed that category learners differed from Korean natives (KR): 1) using VOT heavily for aspirated vs. fortis (similar to KR); 2) using f0 heavily for fortis vs. lenis (KR: use both VOT and f0 cue); 3) using both VOT and f0 cue for aspirated vs. lenis (KR: using f0 heavily).
In production, the repetition task (/t/, /tʰ/, /t*/, /tç/, /tçʰ/, /tç*/) a difference in VOT (short vs. long) for fortis vs. aspirated & lenis as well as a difference in f0 (low vs. high) for lenis vs. aspirated & fortis, with similar cue weighting to KR. However, the reading task differs: lenis produced with a short VOT. The cue weighting varies between stop and affricate, except for aspirated vs. fortis (using VOT heavily) : for fortis vs. lenis, similar use of two cue (stop), using f0 heavily (affricate) ; for lenis vs. aspirated, greater use on VOT (stop), similar use of two cue (affricate).
In this study, perception generally precedes production, with persistent variability, but a complex interaction exists. Our findings indicate that phonetic acquisition of three-way contrasts requires more than a year of learning. However, the learners have reorganized the contrast from two to three-ways and have integrated the acoustic cue of f0 well to be able to make this three-way distinction.

 

Soutenance de Thèse d’Amélie Elmerich

La soutenance aura lieu le mercredi 26 juin à 13h30 à l’adresse suivante :

Maison de la Recherche – Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais 75005 Paris

 

Devant le jury composé de :

  • Béatrice Vaxelaire (Rapporteur), PR (LiLPa, EA1339, Uni. de Strasbourg)
  • Yves Laprie (Rapporteur), DR (Loria, UMR 7503, CNRS/ Uni. de Lorraine)
  • Justin Michel (Examinateur), PU-PH (Aix-Marseille Uni.)
  • Solange Rossato (Examinatrice), MCF (LIG, UMR5217, CNRS/ Uni. Grenoble Alpes)
  • Lise Crevier-Buchman (Directrice), CR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Angélique Amelot (Co-directrice), IR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Jean-François Papon (Co-directeur), PU-PH (Uni. Paris Saclay)

 

La soutenance sera également accessible en visioconférence. Le lien Zoom sera disponible prochainement.

Résumé :

Cette thèse s’intéresse à l’évaluation multiparamétrique de la nasalité à travers quatre axes : aérodynamique, acoustique, volumétrique et perceptif. Ce travail a été l’occasion de parfaire le développement d’un outil d’acquisition aérodynamique : un masque en fibre de papier. Ce masque nous a permis de pallier certains inconvénients des outils d’acquisition aérodynamiques actuels. L’objectif principal était de contribuer à la compréhension de la perturbation de la nasalité dans le cadre de la polypose naso-sinusienne et sa chirurgie. Notre population était composée de quatre patients atteints de polypose naso-sinusienne enregistrés avant et après chirurgie que nous avons comparé à une population de huit locuteurs sains. Notre corpus comprenait des logatomes de type VCV. Outre la variabilité individuelle, nos résultats montrent que la population pathologique reste proche des locuteurs sains pour les études aérodynamique, acoustique et perceptive. En effet, les patrons aérodynamiques des patients sont similaires à ceux des locuteurs sains de même que les moyennes de DAN et de DAO calculées sur chaque phonème. Pour l’étude acoustique, nous avons examiné la durée des voyelles et le spectre moyen oral et nasal. La différence de durée entre voyelles orales et nasales se maintient en préopératoire et postopératoire. Les moyennes de spectre moyen oral et nasal des patients sont proches des locuteurs sains. Pour l’étude volumétrique, à partir de scanners, les volumes d’air naso-sinusiens ont été calculés avant et après chirurgie. Une augmentation du volume a été noté en postopératoire, volume qui se rapproche de celui du témoin. Enfin, l’étude perceptive a montré que la voix et la parole ne sont pas un handicap pour le patient et que la qualité vocale des patients n’est pas perçue comme altérée. La relation entre l’aérodynamique, acoustique, volumétrique et perceptive s’avère complexe. Nous n’avons pas pu relever de liens tangibles en raison notamment de la forte variabilité individuelle. La pathologie ainsi que la chirurgie ne semblent pas perturber la voix et la parole des patients. Nos résultats sont novateurs en étant les premiers à montrer l’efficacité de l’AeroMask pour l’étude de la nasalité.

Mots-clés : Nasalité, Polypose naso-sinusienne, Multiparamétrique, Instrumentation, AeroMask, DAN, DAO, acoustique, perception

Abstract: Multiparametric assessment of nasality: Design and use of an aerodynamic mask applied to a control and pathological population : the AeroMask

This thesis focuses on the multiparametric assessment of nasality through four axes: aerodynamic, acoustic, volumetric and perceptual. This work was an opportunity to perfect the development of an aerodynamic acquisition tool: a paper-fiber mask. This mask enabled us to overcome some of the drawbacks of current aerodynamic acquisition tools. The main objective was to contribute to the understanding of nasal disturbance in the context of nasal polyposis and its surgery. Our population consisted of four patients with nasal polyposis recorded before and after surgery, which we compared with a population of eight healthy speakers. Our corpus included VCV logatoms. Apart from individual variability, our results show that the pathological population remains close to healthy speakers for aerodynamic, acoustic and perceptual studies. Indeed, the aerodynamic patterns of the patients are similar to those of healthy speakers, as are the averages of NAF and OAF calculated on each phoneme. For the acoustic study, we examined vowel duration and the mean oral and nasal spectrum. The difference in duration between oral and nasal vowels was maintained both pre- operatively and postoperatively. The patients’ mean oral and nasal spectra are close to those of healthy speakers. For the volumetric study, sinonasal air volumes were calculated before and after surgery, using CT scans. An increase in volume was noted postoperatively, which was close to that of the control. Finally, the perceptual study showed that voice and speech are not a handicap for the patient, and that the patients’ vocal quality is not perceived as impaired. The relationship between aerodynamics, acoustics, volumetry and perception is complex. We were unable to identify any tangible links, mainly because of the high degree of individual variability. Pathology and surgery do not seem to interfere with patients’ voice and speech. Our results are innovative in that they are the first to demonstrate the effectiveness of the AeroMask in studying nasality.

Keywords : Nasality, Nasal Polyposis, Multiparametric, Instrumentation, AeroMask, Nasal Airflow, Oral Airflow, Acoustics, Perception