This talk presents results of a cross-language study of linguopalatal contact differences between the consonants /t/ and /n/ using electropalatography (EPG). The consonants were produced in a variety of phonetic contexts by 28 individuals, native speakers of six languages (English, French, Japanese, Korean, Serbian, and Spanish). An analysis revealed significantly weaker contact for the nasal than the stop with differences varying in magnitude across languages and positions. For some of the languages (English and Spanish), no differences were observed in medial contexts, where the stop was subject to intervocalic lenition. Overall, the results indicate that the seemingly similar lingual gestures involved in the production of nasals and stops differ in their realizations. These differences are argued to reflect the distinct aerodynamic and physiological requirements involved in the production of consonants of different manners. The manner-specific constraints, in turn, appear to interact with with language-specific allophonic processes and general prosodic effects.
Catégorie d'événements : SRPP
Identification of primary and collateral tracks in stuttered speech
This paper discusses a new framework for the evaluation of the detection of disfluency in speech and natural language processing. We argue for the supervised identification of two tracks of communication, primary and collateral tracks, inspired by the theory of performance from H. Clark, Using Language.
This setting enables a direct quantitative comparison between the detection techniques from the Natural Language Processing(NLP) and Speech Technologies(ST) communities. It finally provides comparison metrics of the models that can be used by speech pathologists, HCI engineers, (psycho)-linguists, whom can have all different needs based on the model predictions.
Finally, we tackle this problem of disfluency identification in adults stuttered speech in the context of semi-directed interviews. We compare word-based prediction and frame-base predictions, using semantic, span and acoustic-prosodic information.
Le rôle de l’épilarynx dans la production des gutturales en Arabe Levantin
Dans cette présentation, je vais me pencher sur la description du rôle de l’épilarynx dans la production des consonnes gutturales en Arabe Levantin. En suivant le modèle « The Laryngeal Articulator Model » de John Esling, une constriction épilaryngale aurait deux conséquences combinées : 1) une rétraction de la racine et du dos de la langue avec un seul geste articulatoire de postériorité et d’abaissement et 2) une constriction des muscles internes et/ou externes du larynx affectant la qualité de la voix. Ces deux conséquences ne doivent pas être vues comme distinctes ; une constriction du larynx conduit à une constriction des muscles de la langue causant sa rétraction. Ici, je m’intéresse aux consonnes gutturales (ex. uvulaires, pharyngalisées, et pharyngales/épilaryngals) en Arabe Levantin, qui pourraient causées différents degrés de rétraction de la langue et de constriction du larynx. Pour ce faire, un corpus d’enregistrements synchronisés d’échographie de la langue, de la hauteur et du contact du larynx avec un ElectroGlottoGraphe ainsi que des données audios a été obtenu auprès de 10 locuteurs (5 hommes, 5 femmes). Les locuteurs ont produit une liste de logatomes de toutes les consonnes possibles en Arabe dans un contexte /ʔV1CV2/ : (V=/i :, a :, u :/ symétrique, C= 30 consonnes (dont 20 analysées), 3 répétitions consécutives ; corpus total = 2700 logatomes (1800 analysés)). Les données sont en cours d’analyses et un intérêt particulier est porté aux effets coarticulatoires de V1 à V2 en passant par la consonne médiane, obtenue à plusieurs fenêtres d’analyses. Je présenterais des résultats préliminaires de l’échographie de la langue et si le temps le permet des mesures acoustiques de la qualité de la voix. En utilisant des analyses additives généralisées (GAMMs), et à long terme des classifications par forêts aléatoires, le but est de fournir un examen détaillé des gestes articulatoires et des conséquences acoustiques de cette constriction épilaryngale.
Vers un atlas sonore des dialectes et langues minoritaires d’Europe de l’Ouest
Dans cette communication, nous décrirons un atlas linguistique qui prend la forme d’un site web présentant des cartes interactives, où l’on peut cliquer sur 280 points d’enquête pour écouter autant d’échantillons de parole et lire une transcription de ce qui est dit, endialectes et langues minoritaires de France hexagonale et des Outre-mer. Nous montrerons comment un site attractif permet de collecter de nouvelles données dans des langues peu dotées, souvent en danger, et comment ces données peuvent être utilisées à des fins d’analyses phonétiques et de dialectométrie. Une histoire d’une minute (« La bise et le soleil ») a été utilisée, transcrite automatiquement par des convertisseurs graphème-phonème et alignée avec le signal audio : une méthodologie qui peut être appliquée à d’autres langues et dialectes. En particulier, nous présenterons des cartes d’Italie (avec une centaine de points d’enquête) et de Belgique (avec près de 20 points d’enquête), dans l’espoir d’étendre ce projet à la Suisse et à l’Espagne.
Consonant strengthening in South America and Mesoamerica
It is often claimed that consonant strengthening is a rarer phenomenon in sound change than consonant weakening. Here, this generalization is tested in a sample of 150 languages from 98 families. Synchronic allophonic processes of consonant strength change — operationalized here as processes in which the degree of oral constriction of a consonant is increased or decreased in a non-consonantal environment — were collected from phonological descriptions and analyzed. The generalization that consonant strengthening is rarer than weakening does not hold across all geographical regions and language families. In particular, the regions of South America and Mesoamerica present exceptions to this trend, showing high rates of consonant strengthening both generally and in comparison to rates of weakening. Both regions also show relatively high rates of typologically unusual strengthening processes, including glide strengthening in nasalized vowel environments and buccalization of glottal consonants. Here I detail the specific patterns observed and discuss possible motivating factors behind this typological feature of South American and Mesoamerican phonology.
Gra[f] ! Le dévoisement final dans les grands corpus de français
Le “dévoisement final” est le processus phonologique par lequel les obstruantes voisées sont dévoisées en fin de mot : /gʁav/ [graf]. Pour comprendre comment ce processus se développe dans les langues, je propose d’étudier ses précurseurs phonétiques dans une langue qui maintient normalement le contraste de voisement en fin de mot : le français. Trois grands corpus de parole sont exploités : ESTER, ETAPE et NCCFr. Une première étude exploite les variantes de prononciation du système d’alignement automatique du LIMSI, et une deuxième est prévue sur les paramètres acoustiques extraits à l’aide du logiciel Praat. Dans les deux cas, j’expose comment différents corrélats acoustiques du voisement des obstruantes en fin de mot varient en fonction du contexte droit (silence ou premier segment du mot suivant), du type d’obstruante (occlusive ou fricative), du lieu d’articulation de l’obstruante, du style de parole et du genre du locuteur. Ce travail est mené en collaboration avec I. Vasilescu (LIMSI), L. Lamel (LIMSI) et M. Adda-Decker (LPP).
La prosodie lexicale, grammaticale et pragmatique dans une langue à tons : le cas du kakabé
Mon exposé portera sur les modalités d’utilisation de la hauteur de la voix, en tant que réalisation de tons lexicaux, de tons grammaticaux ou d’intonations, en prenant comme exemple le kakabé, une langue tonale de la famille mandé. En général, les langues à tons peuvent être placées « sur une échelle de densité tonale » (Gussenhoven 2004) en fonction du nombre de tons sous-jacents par nombre de syllabes. Selon ces termes, kakabé est une langue à densité tonale assez faible : une grande partie des tons réalisés sont issus de processus tonals et ne sont pas définis lexicalement. Le kakabé est une langue à deux tons (H vs. B), avec downdrift, relèvement du ton H, un ton flottant B, et un certain nombre de processus tonals, tels que l’insertion du ton H, la propagation du ton, l’aplatissement du contour HBH. La distance entre les tons lexicaux sous‐jacents et leur réalisation de surface peut être assez importante. Chacun des processus tonals est appliqué dans une unité prosodique particulière. Par conséquent, les processus tonals participent au découpage du discours en unités prosodiques. La contribution analytique principale de ma recherche sur la prosodie du kakabé est constituée par l’analyse de l’intonation dans sa relation avec le ton, un sujet qui n’a guère été étudié pour les langues mandé et très peu pour les langues de l’Afrique sub-Saharienne en général, mis à part pour les langues bantoues (voir Downing et Rialland 2016). Le kakabé comporte des tons de frontière qui servent à signaler la force illocutoire de l’énoncé. Les tons lexicaux et les tons de frontière coexistent avec des opérations intonatives sur la courbe de F0.
Downing, Laura J., and Annie Rialland. 2016. Intonation in African Tone Languages. De Gruyter.
Gussenhoven, Carlos. 2004. The Phonology of Tone and Intonation. Cambridge ; New York : Cambridge University Press.
Spoken language acquisition and the challenge of skill integration
Spoken communication is a biological behavior emerging very early in development and effortlessly in most children. It is shaped by multi-faceted developments in the speech motor, perception, lexical and phonological domains, which develop in a seemingly parallel fashion. While most of those competences have been well studied in the last decades, developmental interactions between domains have typically been conducted in separate strands. Yet, findings suggest they interact dynamically over time.
In this presentation, I will first discuss research conducted with colleagues addressing the development of coarticulation in young children. Coarticulatory processes emerge organically with the first babbled syllables at around 6-8 months of age and hence initiate a fundamental ontogenetic transition from a rudimentary vocal repertoire of vegetative coos and isolated vocalizations tied to immediate events and needs to a sophisticated combinatorial spoken language system. Our research shows that while the maturation of the speech motor system is certainly crucial to spoken language fluency, the concurrent development of other skills must be considered to explain children’s individual trajectories. I will then present a recent study illuminating non-linear interactions between the motor, lexical and phonological domains during the transition between preschool and primary school. Last, I will introduce preliminary results suggesting an early interaction between infants’ attention to linguistically relevant orofacial information and their vocal repertoire. Altogether, the findings motivate an integrated approach of spoken language development in which various skills are envisioned as interacting dynamically over time and their interaction is fundamental to the growth of each individual skill.
Phonology vs phonetics : The adaptation of the French rhotic into Berber
This paper examines the adaptation of the French rhotic in Berber. In loanwords borrowed from (“Standard”) French, the uvular fricative is systematically interpreted as a coronal tap, despite the fact that Berber has phonemic /ɣ/ and /x/ : e.g. byʁo > biru ‘office’, sɛʁʒɑ̃ > ʃarʒan ‘sergeant’, tχɛ̃ > træn ‘train’.
Two hypotheses are discussed : One which claims that the adaptation of loanwords is done by bilinguals who have access to the underlying representation of the French rhotic (Paradis & LaCharité 2001), and the other which argues that loanwords adaptation is governed by phonetic (perceptual) cues (Peperkamp et al. 2008, Bakst & Katz 2014, Peperkamp 2015). Under the phonetic hypothesis, Berber speakers should have mapped the French rhotic onto the closest sound in their language, namely the velar fricative /ɣ/ or /x/. As to the analysis advocated by Paradis & LaCharité, one wonders how monolingual uneducated people, who arrived in France in the early 1970s, interpret the French uvular systematically as a coronal although they don’t have access to the phonology of the source language (e.g. [ʁ]ouen > [ruwa] ‘city name’, met[ʁ]o > [metˤro] ‘subway’, a[ʁ]genteuil > [arʒantæj] ‘city name’, place voltai[ʁ]e > [blɑsˤbuntir]).
This paper aims at demonstrating that the adaptation of the French rhotic in Berber is a phonologically driven process. Taking Paradis & LaCharité (2001) as a starting point, it is argued that the selection of the coronal tap at the expense of the velar fricative is due to its phonotactics. Berber speakers identify the French r as a sonorant, which patterns with l in complex onsets. This is further supported by the hypothesis put fourth in Lahrouchi (2010), according to which the obstruent-sonorant cluster is active in the Berber phonology, despite the absence of complex onsets in the language (Ridouane et al. 2014, Lahrouchi 2018).


