Soutenance de Thèse d’Amélie Elmerich

La soutenance aura lieu le mercredi 26 juin à 13h30 à l’adresse suivante :

Maison de la Recherche – Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais 75005 Paris

 

Devant le jury composé de :

  • Béatrice Vaxelaire (Rapporteur), PR (LiLPa, EA1339, Uni. de Strasbourg)
  • Yves Laprie (Rapporteur), DR (Loria, UMR 7503, CNRS/ Uni. de Lorraine)
  • Justin Michel (Examinateur), PU-PH (Aix-Marseille Uni.)
  • Solange Rossato (Examinatrice), MCF (LIG, UMR5217, CNRS/ Uni. Grenoble Alpes)
  • Lise Crevier-Buchman (Directrice), CR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Angélique Amelot (Co-directrice), IR (LPP, UMR7018, CNRS/Uni. Sorbonne Nouvelle)
  • Jean-François Papon (Co-directeur), PU-PH (Uni. Paris Saclay)

 

La soutenance sera également accessible en visioconférence. Le lien Zoom sera disponible prochainement.

Résumé :

Cette thèse s’intéresse à l’évaluation multiparamétrique de la nasalité à travers quatre axes : aérodynamique, acoustique, volumétrique et perceptif. Ce travail a été l’occasion de parfaire le développement d’un outil d’acquisition aérodynamique : un masque en fibre de papier. Ce masque nous a permis de pallier certains inconvénients des outils d’acquisition aérodynamiques actuels. L’objectif principal était de contribuer à la compréhension de la perturbation de la nasalité dans le cadre de la polypose naso-sinusienne et sa chirurgie. Notre population était composée de quatre patients atteints de polypose naso-sinusienne enregistrés avant et après chirurgie que nous avons comparé à une population de huit locuteurs sains. Notre corpus comprenait des logatomes de type VCV. Outre la variabilité individuelle, nos résultats montrent que la population pathologique reste proche des locuteurs sains pour les études aérodynamique, acoustique et perceptive. En effet, les patrons aérodynamiques des patients sont similaires à ceux des locuteurs sains de même que les moyennes de DAN et de DAO calculées sur chaque phonème. Pour l’étude acoustique, nous avons examiné la durée des voyelles et le spectre moyen oral et nasal. La différence de durée entre voyelles orales et nasales se maintient en préopératoire et postopératoire. Les moyennes de spectre moyen oral et nasal des patients sont proches des locuteurs sains. Pour l’étude volumétrique, à partir de scanners, les volumes d’air naso-sinusiens ont été calculés avant et après chirurgie. Une augmentation du volume a été noté en postopératoire, volume qui se rapproche de celui du témoin. Enfin, l’étude perceptive a montré que la voix et la parole ne sont pas un handicap pour le patient et que la qualité vocale des patients n’est pas perçue comme altérée. La relation entre l’aérodynamique, acoustique, volumétrique et perceptive s’avère complexe. Nous n’avons pas pu relever de liens tangibles en raison notamment de la forte variabilité individuelle. La pathologie ainsi que la chirurgie ne semblent pas perturber la voix et la parole des patients. Nos résultats sont novateurs en étant les premiers à montrer l’efficacité de l’AeroMask pour l’étude de la nasalité.

Mots-clés : Nasalité, Polypose naso-sinusienne, Multiparamétrique, Instrumentation, AeroMask, DAN, DAO, acoustique, perception

Abstract: Multiparametric assessment of nasality: Design and use of an aerodynamic mask applied to a control and pathological population : the AeroMask

This thesis focuses on the multiparametric assessment of nasality through four axes: aerodynamic, acoustic, volumetric and perceptual. This work was an opportunity to perfect the development of an aerodynamic acquisition tool: a paper-fiber mask. This mask enabled us to overcome some of the drawbacks of current aerodynamic acquisition tools. The main objective was to contribute to the understanding of nasal disturbance in the context of nasal polyposis and its surgery. Our population consisted of four patients with nasal polyposis recorded before and after surgery, which we compared with a population of eight healthy speakers. Our corpus included VCV logatoms. Apart from individual variability, our results show that the pathological population remains close to healthy speakers for aerodynamic, acoustic and perceptual studies. Indeed, the aerodynamic patterns of the patients are similar to those of healthy speakers, as are the averages of NAF and OAF calculated on each phoneme. For the acoustic study, we examined vowel duration and the mean oral and nasal spectrum. The difference in duration between oral and nasal vowels was maintained both pre- operatively and postoperatively. The patients’ mean oral and nasal spectra are close to those of healthy speakers. For the volumetric study, sinonasal air volumes were calculated before and after surgery, using CT scans. An increase in volume was noted postoperatively, which was close to that of the control. Finally, the perceptual study showed that voice and speech are not a handicap for the patient, and that the patients’ vocal quality is not perceived as impaired. The relationship between aerodynamics, acoustics, volumetry and perception is complex. We were unable to identify any tangible links, mainly because of the high degree of individual variability. Pathology and surgery do not seem to interfere with patients’ voice and speech. Our results are innovative in that they are the first to demonstrate the effectiveness of the AeroMask in studying nasality.

Keywords : Nasality, Nasal Polyposis, Multiparametric, Instrumentation, AeroMask, Nasal Airflow, Oral Airflow, Acoustics, Perception

Soutenance de Thèse de Dayeon Yoon

La soutenance aura lieu le jeudi 20 juin 2024 à 9h30 à l’adresse suivante :

Maison de la Recherche – Université Sorbonne Nouvelle
Salle Claude Simon
4 rue des Irlandais
75005 Paris

Elle se déroulera en présence du jury composé de :

  • Rudolph Sock (Rapporteur) Professeur, Université de Strasbourg
  • Jane Stuart-Smith (Rapporteuse) Professeur, Glasgow University
  • Melanie Weirich (Examinatrice) Professeur, Universität Jena
  • Hiyon Yoo (Examinatrice) Maître de conférence, Université Paris Cité
  • Cédric Gendrot (Examinateur) Professeur, Université Sorbonne Nouvelle
  • Nicolas Audibert (Co-directeur) Maître de conférence, Université Sorbonne Nouvelle
  • Cécile Fougeron (Directrice de thèse) Directeur de recherche HDR, CNRS

La soutenance sera en anglais et également accessible en visioconférence.

 

Lien de la visioconférence : 

https://cnrs.zoom.us/j/99365688414?pwd=RWRd3MAXy7PCW5Qn3C1eLXi7iwQwgE.1

Résumé :

Cette thèse examine les spécificités de la parole produite par les hommes et les femmes en fonction de la morphologie corporelle et de la langue parlée. Dans la première étude, les indices phonétiques segmentaux liés à la voix et à la parole d’une part, et la coarticulation nasale d’autre part, sont comparés entre 70 hommes et femmes parlant coréen ou français. Dans la seconde étude, les indices acoustiques de la parole sont reliés à la taille et au poids des locuteurs. Enfin, la capacité de 105 auditeurs coréens et français à estimer la taille et le poids des locuteurs à partir de la parole est évaluée. Des différences acoustiques entre les sexes sont observées dans la première étude, suggérant une hauteur vocale et des fréquences de résonance du conduit vocal plus élevées chez les femmes, avec un degré de souffle plus important et un degré de bruit plus faible. Ces différences entre les sexes sont plus marquées chez les Français que chez les Coréens, notamment pour le degré de souffle et de bruit. Chez les Coréens, une réduction de la nasalité de la consonne nasale en position initiale de groupe accentuel est plus marquée chez les hommes, tandis que celle de la durée est plus marquée chez les femmes. Dans la seconde étude, le lien entre les dimensions corporelles et les indices acoustiques de la parole est plus important chez les hommes. Les auditeurs sont plus performants dans l’estimation de la taille des locuteurs dépassant une certaine taille, correspondant à celle des hommes étudiés. Ces résultats sont discutés en relation avec le rôle de la parole en tant que marqueur sociophonétique d’une part, et en tant que marqueur de dominance physique dans la sélection sexuelle d’autre part.

Mots clés : morphologie corporelle, variation inter-langues, voix, parole, coarticulation nasale, coréen, français

Abstract: Effects of body morphology and spoken language on male and female speech

This thesis investigates the specificities of speech produced by male and female speakers as a function of body morphology and spoken language. In the first study, segmental phonetic cues related to voice and speech on one hand, and nasal coarticulation on the other hand, are compared between 70 male and female speakers of Korean or French. In the second study, acoustic cues of speech are linked to the height and weight of speakers. Finally, the ability of 105 Korean and French listeners to estimate the height and weight of speakers from speech is evaluated. Acoustic differences between sexes are observed in the first study, suggesting higher vocal pitch and resonance frequencies of the vocal tract in female speakers, with a higher degree of breathiness and lower degree of noise. These sex differences are more pronounced among French speakers than among Koreans, especially in terms of breathiness and noise. Among Koreans, a reduction in the nasality of nasal consonants in the initial position of accentual groups is more pronounced in male speakers, while that of duration is more pronounced in female speakers. In the second study, the link between bodily dimensions and acoustic cues of speech is stronger among male speakers. Listeners are more accurate in estimating the height of speakers exceeding a certain height, corresponding to that of the male speakers studied in this thesis. These results are discussed in relation to the role of speech as a sociophonetic marker on one hand, and as a marker of physical dominance in sexual selection on the other hand.

Keywords: body morphology, crosslinguistic variation, voice, speech, nasal coarticulation, Korean, French 

Soutenance de Thèse de Jinyu Li

La soutenance aura lieu le mardi 19 décembre 2023 à 16 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Mezzanine
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Pascal PERRIER (Rapporteur) : Professeur, Grenoble INP/Université Grenoble Alpes
  • Corine ASTESANO (Rapportrice) : Professeur, Université Toulouse – Jean Jaurès
  • Louis GOLDSTEIN (Examinateur) : Professeur, University of Southern California
  • Noël NGUYEN (Examinateur) : Professeur, Aix-Marseille Université
  • Yao YAO (Examinateur) : Professeur adjoint, Hong Kong Polytechnic University
  • Cécile FOUGERON (Directrice) : Directrice de recherche, Université Sorbonne Nouvelle
  • Leonardo LANCIA (Directeur) : Chargé de recherche, Aix-Marseille Université

 

La soutenance sera en anglais et également accessible en visioconférence.

 

Lien de la visioconférence : 

https://cnrs.zoom.us/j/93499505383?pwd=QWZtWUlicng0T2JMSEl5NlIxUXAwQT09


ID de réunion : 934 9950 5383

Code secret : cYv4cj

 

Résumé :

Pour s’adapter aux imprévus lors de la production de la parole, le système moteur intègre les informations sensorielles (ex. le retour auditif), et bénéficie du groupement rythmique, qui est caractérisé par la prosodie. Cependant, le système sensorimoteur d’un locuteur traite différemment les événements acoustiques relatifs à sa propre voix par rapport à ceux d’autrui. Cette thèse vise à examiner la flexibilité de la production de la parole en analysant le rôle organisateur de la prosodie et la sensation subjective d’un locuteur sur le contrôle de sa voix (c.-à-d. le sens d’agentivité relatif à sa voix).

Des expériences des perturbations du retour auditif ont été menées chez des locutrices francophones. Avec le retour auditif retardé (DAF), la différence de durée entre les voyelles accentuées et non accentuées s’est accrue, soulignant une plus grande flexibilité durant la production des accents. De plus, le DAF a induit une réorganisation du rythme de la parole avec un renforcement du groupement syllabique. Avec un décalage continu de la fréquence fondamentale (f0) du retour auditif, la majorité des locutrices ont aligné leur f0 sur celle modifiée du retour auditif, suggérant que leur système sensorimoteur aurait traité la voix perçue comme une entrée externe. La présence simultanée du DAF et d’un décalage de la f0 a entraîné une réduction des effets du DAF par rapport à la condition sans décalage de la f0. Cette observation suggère une réduction du sens d’agentivité relatif à la voix chez les locutrices, ainsi qu’une interaction entre l’organisation rythmique et le sens d’agentivité dans les processus sensorimoteurs de production de la parole.

Mots-Clés : contrôle sensorimoteur de la parole, retour auditif, rythme de la parole, structure prosodique, sens d’agentivité, alignement phonétique, traitement de la parole

 

Abstract: Interaction between rhythmic structure and sense of agency in speech production

To adapt to unforeseen circumstances during speech production, the motor system integrates sensory information (e.g., auditory feedback) and benefits from rhythmic grouping, which is characterized by prosody. However, a speaker’s sensorimotor system processes acoustic events related to their own voice differently from those of others. This thesis aims to examine the flexibility of speech production by analyzing the organizing role of both prosody and a speaker’s subjective sensation of control over his voice (i.e., the sense of agency related to his voice).

Experiments of auditory feedback perturbations were conducted with French-speaking female speakers. With delayed auditory feedback (DAF), the duration difference between accented and unaccented vowels increased, highlighting greater flexibility during accent production. Furthermore, DAF induced a reorganization of speech rhythm with enhanced syllabic grouping. With a constant shift in the fundamental frequency (f0) of auditory feedback, the majority of female speakers aligned their f0 with the modified auditory feedback, suggesting that their sensorimotor system processed the perceived voice as an external input. The simultaneous presence of DAF and an f0 shift resulted in a reduction of DAF effects compared to the condition without an f0 shift. This observation suggests a reduction in the sense of agency related to the voice among female speakers, as well as an interaction between rhythmic organization and sense of agency in sensorimotor processes of speech production.

Key words: sensorimotor control of speech, auditory feedback, speech rhythm, prosodic structure, sense of agency, phonetic alignment, speech processing

 

Soutenance de Thèse de Xinyuan Zhang

La soutenance aura lieu le mardi 12 décembre 2023 à 9 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Claude Simon
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Mme. Annie Rialland (Présidente), Directrice de Recherche émérite au CNRS, Sorbonne-Nouvelle
  • M. Marc Duval (Rapporteur), Professeur, Université de Paris IV
  • M. Guillaume Jacques (Rapporteur), Directeur de Recherche CNRS, INALCO-EHESS-EPHE
  • Mme. Jiayin Gao (Examinatrice), Chargée de Recherche CNRS, Sorbonne-Nouvelle
  • M. Anton Antonov (Examinateur), Maître de Conférences, INALCO
  • M. Pierre Hallé (Directeur), Directeur de Recherche émérite CNRS, Sorbonne-Nouvelle

 

La soutenance sera en français et également accessible en visioconférence :

https://cnrs.zoom.us/j/99001034405?pwd=RXVzS3EzdzMwRUlWaldlRkNsM01NZz09

ID de réunion: 990 0103 4405
Code secret: 3UU2DV

Vous pouvez télécharger le résumé court (Français et Anglais) en cliquant ici

 

Soutenance de Thèse de Nathalie Lévêque

La soutenance aura lieu le vendredi 3 novembre 2023 à 14 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Marina Laganaro (Rapporteur) Professeur à l’Université de Genève
  • Liziane Bouvier (Rapporteur) Professeur à l’Université Mc Gill, Québec
  • David Grabli (Examinateur) Professeur Universitaire Praticien Hospitalier, Hôpital de la Pitié-Salpêtrière, Paris
  • Claire Pillot-Loiseau (examinatrice), professeur, Université Sorbonne Nouvelle, Paris 3
  • Cécile Fougeron (Directrice de thèse) Directeur de recherche CNRS, LPP, Paris
  • Gaëlle Bruneteau (Co-directrice de thèse) Professeur Universitaire Praticien Hospitalier, Hôpital de la Pitié-Salpêtrière, Paris

Résumé

Distinction entre maladies du motoneurone : les marqueurs acoustiques, révélateurs de profils dysarthriques différents

Cette thèse étudie les apports de l’exploration de la parole dans le diagnostic différentiel entre les trois principales maladies du motoneurone de l’adulte, la sclérose latérale amyotrophique (SLA), la sclérose latérale primitive (SLP) et la maladie de Kennedy (MK). La parole de locuteurs contrôles et de patients présentant ces maladies, a été comparée, au travers de quatre dimensions : la phonation ;  la coordination pneumo-phonatoire ;  la précision articulatoire étudiée sous l’angle acoustique et perceptif ; les aspects temporels dans des tâches de performance et dans la parole continue (lecture et spontané) ; et l’organisation du discours explorée au travers de la durée des continuums de parole et des pauses dans le spontané. Cette thèse met en évidence des marqueurs acoustiques détectant la présence d’une dysarthrie, avec notamment une hypoarticulation retrouvée dans toutes les populations présentant une dysarthrie, et des aspects temporels très perturbés dans les populations SLA et SLP. Par ailleurs, ce travail identifie des marqueurs acoustiques diagnostiques, discriminant les profils dysarthriques entre eux. Le profil dysarthrique des populations SLA et SLP, se distingue clairement de celui de la population MK. Bien que très similaires, nos résultats montrent des différences dans le profil dysarthrique des populations SLA et SLP, soulevant des effets probablement plus importants de la perturbation de la programmation des gestes articulatoires dans la SLP, et de l’instabilité articulatoire dans la SLA. Ce travail ouvre des perspectives d’approfondissement dans la caractérisation de chacun de ces profils dysarthriques.


Distinguishing between motor neuron diseases : acoustic markers reveal different dysarthric profiles

This dissertation studies the contribution of speech exploration to differential diagnosis between the three main motor neuron diseases of adults, amyotrophic lateral sclerosis (ALS), primary lateral sclerosis (PLS) and Kennedy’s disease (KD). The speech of control speakers and of patients with these diseases was compared along four dimensions: phonation; pneumo-phonatory coordination; articulatory precision studied from acoustic and perceptual angles; temporal aspects in performance tasks and in continuous speech (reading and spontaneous); and speech organization explored through the duration of speech continua and pauses in spontaneous speech. This thesis highlights acoustic markers detecting the presence of dysarthria, notably hypoarticulation found in all dysarthric populations, and highly disturbed temporal aspects in the ALS and PLS populations. This study also identifies diagnostic acoustic markers that discriminate between dysarthric profiles. The dysarthric profile of the ALS and PLS populations clearly differs from that of the KD population. Although very similar, our results show differences in the dysarthric profile of the ALS and PLS populations, pointing to the probable greater effects of disrupted programming of articulatory gestures in PLS, and articulatory instability in ALS. This work opens up prospects for further characterization of each of these dysarthric profiles.

Soutenance de Thèse de Clara Ponchard

La soutenance aura lieu le mardi 5 septembre 2023 à 16 heures à la

Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • David GRABLI (Rapporteur), Professeur, Praticien hospitalier, Service de neurologie, Hôpital
    de la Pitié Salpetrière, Paris
  • François PELLEGRINO (Rapporteur), Directeur de recherche CNRS, DDL Lyon 2
  • Claire PILLOT-LOISEAU (Examinatrice), Professeure, Université Sorbonne nouvelle, Paris 3
  • Jody KREIMAN (Examinatrice), Professeure, University of California, Los Angeles
  • John KINGSTON (Examinateur), Professeur, University of Massachusetts, Amherst
  • Lise CREVIER-BUCHMAN (Co-Directrice), Chargée de Recherche CNRS, Hôpital Foch, Université Sorbonne nouvelle, Paris 3
  • Didier DEMOLIN (Co-Directeur), Professeur émérite, Université Sorbonne nouvelle, Paris 3

Résumé
Cette thèse porte sur les troubles de la parole qui se manifestent chez les femmes atteintes de la maladie de Parkinson. Nous avons choisi de nous concentrer sur une population féminine car, bien que les femmes atteintes de la maladie de Parkinson représentent une part importante de la population, les études prenant en compte le sexe féminin comme une variable cruciale sont fortement sous-représentées. De plus, les mesures aérodynamiques sont rarement exploitées. Ces constats ont motivé cette recherche en soulignant la nécessité d’une description objective, quantifiée et  détaillée de la voix parkinsonienne. Pour cela, nous avons réalisé une évaluation instrumentale multiparamétrique sur un corpus de 74 femmes, dont 37 femmes parkinsoniennes et 37 témoins,
appariées par âge. Notre recherche se distingue par (1) l’élaboration d’un cadre conceptuel et méthodologique pour le traitement de la parole normale et dysarthrique, en utilisant une approche innovante pour segmenter et mesurer automatiquement les données aérodynamiques et acoustiques ; (2) la mise en place d’une étude multiparamétrique qui intègre des mesures acoustiques et
aérodynamiques, et qui explore la relation entre la pression sous-glottique et la fréquence fondamentale ; (3) l’élaboration d’un modèle de production normale afin d’identifier les déviances spécifiques à la parole parkinsonienne ; (4) l’identification des sources de variation des paramètres aérodynamiques et acoustiques, tels que les effets du vieillissement ou de la prise de mesure ; et (5) la détection des caractéristiques les plus altérées et des mesures les plus performantes pour discriminer la parole parkinsonienne via une analyse multiparamétrique et une tâche de  classification automatique des marqueurs vocaux.

Abstract
This thesis focuses on the speech disorders that occur in women suffering from Parkinson’s disease, known as hypokinetic dysarthria. We chose to focus on a female population because, although
women with Parkinson’s disease represent a significant portion of the population, studies that consider gender as a crucial variable are strongly underrepresented. Moreover, aerodynamic measures, although more difficult to acquire and automatically process than acoustic measures, are rarely exploited. These observations motivated this research, highlighting the need of an objective, quantified, and detailed description of the voice of women with Parkinson’s disease. To this end, we carried out a multiparametric instrumental evaluation on a corpus of 74 women, including 37 with Parkinson’s and 37 controls, matched according to their age. Our research stands out by (1) the development of a conceptual and methodological framework for the processing of normal and dysarthric speech, using an innovative approach to segment and automatically measure aerodynamic and acoustic data; (2) the implementation of a multiparametric study that integrates acoustic and aerodynamic measurements, and explores the relationship between subglottal pressure and fundamental frequency; (3) the establishment of a normal production model to identify deviations specific to Parkinsonian speech; (4) the identification of sources of variation in aerodynamic and acoustic parameters, such as the effects of aging or the measurement process; and (5) the detection of the most altered features and the most effective measurements to discriminate Parkinsonian speech through a multiparametric analysis and an automatic classification task of vocal markers.

Soutenance de Thèse d’Alexis Dehais Underdown

La soutenance aura lieu le vendredi 8 septembre 2023 à 16 heure à la Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Athéna
4 rue des Irlandais
75005 Paris
Devant le jury composé de :

  • Didier Demolin                        Professeur Emérite, Université Sorbonne nouvelle, Paris 3, Co-Directeur
  • Lise Crevier Buchman            Chargée de Recherche CNRS, Hôpital Foch, Université Sorbonne nouvelle, Paris 3, Co-Directrice
  • Alice Turk                                  Professeure, University of Edinburgh, Rapporteuse
  • Yves Laprie                                Directeur de recherche CNRS, Loria, Nancy, Rapporteur
  • Bryan Gick                                 Professeur, University of British Columbia, Examinateur
  • John Kingston                          Professeur, University of Massachusetts, Examinateur
  • Claire Pillot Loiseau                Professeure, Université Sorbonne nouvelle, Paris 3, Examinatrice

Résumé:

Avant d’être un objet d’étude scientifique, le Human Beatbox (HBB) est avant tout une pratique musicale. Les beatboxeurs et les beatboxeuses utilisent leur conduit vocal pour produire des sons musicaux : sons de batterie, instruments à vent ou à corde, musique électronique … Comment est produit le Human Beatbox ? Quelles sont les capacités du conduit vocal humain ? Existe-t-il un lien entre la production du Beatbox et de la parole ? Cette thèse tente d’apporter des éléments de discussion sur ces questions. À partir de données articulatoires, aérodynamiques et acoustiques, nous proposons une analyse de la production du Human Beatbox à différentes vitesses (90, 120, 150 battements par minute). Nos résultats montrent que les sujets utilisent des mécanismes de production similaires aux locuteurs des langues. Toutefois, ils combinent un plus grand nombre de mécanismes différents. Le Human Beatbox possède les propriétés d’un système combinatoire discret (Proctor et al., 2013). Les résultats sur les effets du tempo suggèrent que les stratégies individuelles de réorganisation temporelle des gestes sont similaires aux stratégies proposées par Byrd et Tan (1996). En effet, les sujets manipulent la durée des gestes et/ou des intervalles séparant les gestes. On a observé chez 2 sujets, des contraintes de coordination entre les gestes d’initiation et d’articulation. Le Human Beatbox jette un regard différent sur la phonétique en permettant d’actualiser son cadre théorique et de passer d’une approche purement linguistique à une approche anthropophonique (Catford, 1977; Lindblom, 1990) des phénomènes phonétiques.
Mots-clés : Human Beatbox, Phonétique, Articulation, Aérodynamique, Acoustique, Tempo

Soutenance de Thèse de Daria D’Alessandro

La soutenance aura lieu le :
jeudi 15 décembre 2022 à 14h00
à la Maison de la Recherche de l’Université Sorbonne Nouvelle
Salle Claude Simon
4 rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Pascal Perrier (Rapporteur) Professeur, Grenoble-INP, GIPSA-lab

  • Douglas H. Whalen (Rapporteur) Professeur, CUNY, Haskins Laboratories

  • Véronique Delvaux (Examinatrice) Chercheur qualifié FNRS, UMONS

  • Anne Hermes (Examinatrice) Chargée de recherche CNRS, LPP

  • Cécile Fougeron (Directrice de thèse) Directeur de recherche CNRS, LPP

Résumé

La coarticulation anticipatoire se réfère à l’anticipation des mouvements articulatoires pour la réalisation de cibles de parole à venir et peut être considérée comme un indice de planification. Dans quatre études, la coarticulation anticipatoire V-à-V est étudiée dans différents Troubles Moteurs de la Parole, i.e. Apraxie de la Parole et Dysarthrie associée à la SLA, la maladie de Wilson, et la maladie de Parkinson (et comparée à la coarticulation C-à-V), chez des adultes âgés de 20 à 93 ans, et dans un groupe restreint de locutrices dans différentes conditions de parole : tempo lent, rapide et normal, dans un mot, à travers une frontière de mot et de proposition relative. Les résultats montrent une réduction de la coarticulation V-à-V dans l’Apraxie de la Parole et la Dysarthrie, qui pourrait être expliquée par des déficits spécifiques à ces pathologies. Une réduction non-linéaire de la coarticulation avec l’âge semble liée à un ralentissement du débit jusqu’à 70 ans, alors qu’une relation directe n’est pas trouvée pour les locuteurs plus âgés. Les différences inter-individuelles de coarticulation en réponse aux changements de tempo suggèrent que la relation entre la coarticulation et le débit articulatoire est spécifique au locuteur. Des variations inter-individuelles de coarticulation sont trouvées aussi en fonction du type de frontière et ne sont que partiellement expliquées par le phrasé prosodique. Ces résultats sont discutés selon deux axes, l’un traitant de la taille des unités de planification motrice dans la parole, et l’autre discutant comment peuvent être modélisées les variations de coarticulation en fonction du locuteur et de la population.

Soutenance de Thèse de Michaela Pernon

La soutenance aura lieu le :
vendredi 25 novembre 2022 à 14h30
au Campus Nation de l’Université Sorbonne Nouvelle
Amphithéâtre B015, RDC
8 avenue de Saint Mandé
75012 Paris

Devant le jury composé de :

  • M. David GRABLI, PU-PH, HDR, Institut du Cerveau, HU Pitié-Salpêtrière, Paris, Rapporteur ;
  • M. Serge PINTO, DR, HDR, CNRS-LPL, Université Aix-Marseille, Rapporteur ;
  • Mme Lise CREVIER-BUCHMAN, PH, CRHC, HDR, CNRS-LPP, Université Sorbonne Nouvelle, Paris, Examinatrice ;
  • Mme Marina LAGANARO, PR, Université de Genève, Examinatrice ;
  • M. Vincent MARTEL-SAUVAGEAU, PR Agrégé, Chercheur régulier, Université Laval, Québec, Examinateur ;
  • Mme Cécile FOUGERON, DR, HDR, CNRS-LPP, Université Sorbonne Nouvelle, Paris, Directrice de thèse.

Résumé

Cette thèse examine les apports d’approches d’évaluation perceptive globale, acoustique et cognitive, pour le diagnostic et la caractérisation de la parole des locuteurs présentant un trouble moteur acquis de la parole (MSD), dysarthrie et/ou apraxie de la parole (AoS).

Pour cela, trois études ont été menées chez quatre groupes de locuteurs: neurotypiques, pathologiques présentant une AoS, ou une dysarthrie hypokinétique dans la maladie de Parkinson, ou une dysarthrie mixte flasque-spastique dans la sclérose latérale amyotrophique. Ces études, partiellement basées sur le corpus MonPaGe-2.0.s, portaient respectivement sur chaque approche: (i) une tâche de classification auditivo-perceptive multijuges des MSDs, (ii) une analyse phonético-acoustique discrète par dimension de parole des locuteurs aux taux de précision les plus bas et les plus élevés en (i), (iii) un paradigme de double tâche évaluant chez des locuteurs neurotypiques les effets d’une demande attentionnelle et exécutive sur des tâches de parole et non verbales.

Cette thèse montre que les approches d’évaluation perceptive globale et acoustique diffèrent peu pour le diagnostic des MSDs, ne permettant pas de diagnostiquer les MSDs très légers. L’approche acoustique permet une caractérisation quantifiée des profils des MSDs en moyenne sur trois dimensions de parole. Les effets de double tâche s’avèrent prometteurs pour une application clinique. Ces trois études objectivent des différences selon les tâches de parole. Leur demande cognitivo-motrice, dont l’examen permettrait d’affiner le diagnostic différentiel des MSDs et leur caractérisation, constitue l’approche cognitive de l’évaluation de la parole à part entière.

Soutenance de Thèse de Gabriele Chignoli

La soutenance aura lieu le :
jeudi 15 septembre 2022 à 14h00
à la Maison de la recherche de l’Université Sorbonne Nouvelle
salle Claude Simon
4, rue des Irlandais
75005 Paris

Devant le jury composé de :

  • Damien LOLIVE HDR Université de Rennes 1, Rapporteur
  • Ioana VASILESCU HDR, CNRS – LISN Université Paris-Saclay, Rapporteuse
  • Jean-François BONASTRE PR, CNRS – LIA – Université d’Avignon, Examinateur
  • Cécile FOUGERON DR, CNRS – LPP – Université Sorbonne Nouvelle, Examinatrice
  • Christine MEUNIER DR, CNRS – LPL – Université Aix-Marseille, Examinatrice
  • Cédric GENDROT HDR, CNRS – LPP – Université Sorbonne Nouvelle, Directeur de thèse.

 

Résumé

La décomposition du signal vocal en unités phonétiquement significatives permet d’analyser les variations inter- et intra- locuteur. Ces unités sont des composantes associées à des caractéristiques dont la nature est liée aux aspects physiques, psychologiques et sociaux d’un locuteur. Dans cette thèse, nous comparons une caractérisation perceptive, une analyse phonétique et des techniques de modélisation avancées par des réseaux de neurones à convolution (CNN).

L’analyse des clusterings montre que les résultats perceptifs sont cohérents avec ceux obtenus par les approches CNN et phonétique, ce qui soutient leurs applications en phonétique. Nos résultats mettent en évidence que les spectrogrammes sont la représentation de la parole la plus précise pour l’identification des locuteurs ( % de bonnes réponses en moyenne). Les formants et des harmoniques plus élevés sont plus importants dans la caractérisation des voix féminines. En revanche, les caractéristiques de la qualité de la voix, telles que le soue et la raucité, jouent un rôle majeur dans la caractérisation des voix masculines. Le lien entre les coecients cepstraux à fréquence Mel (MFCC) et les mesures phonétiques classiques est également examiné. Les MFCC sont principalement liés à l’intensité et à f dans la caractérisation des voix féminines, tandis qu’aux distributions d’énergie et à la forme spectrale de bas niveau pour celle des voix masculines.

Nos résultats confirment l’importance de la description de la variation intra-locuteur pour une compréhension plus complète des différences entre locuteurs.