Kim Gerdes

HDR de Kim Gerdes soutenue le 29/11/2018, à l’Université de Paris Nanterre, Bâtiment B (Grappin) Salle Paul Ricœur B016

« Du pareil au même : sur les paradigmes en syntaxe »

Jury :

  • Ryan Abbott, University of Surrey et UCLA
  • Eva Hajičová, Univerzita Karlova, Prague
  • Sylvain Kahane (référent), Université Paris Nanterre
  • Thierry Poibeau (rapporteur), CNRS et ENS, Paris
  • Benoît Sagot, Inria, Paris
  • Irène Tamba, EHESS, Paris
  • Leo Wanner (rapporteur), Universtitat Pompeu Fabra, Barcelona

Résumé :

Comme une grande partie de la communauté TAL, j’ai basculé des grammaires formelles au développement de treebank et à l’apprentissage automatique de modèles syntaxiques. Cette habilitation est l’occasion de replacer ce parcours dans un historique de l’évolution des sciences en général et de la linguistique en particulier.
Je tente d’estimer l’impact de l’arrivée des machines intelligentes sur la syntaxe. Les questions centrales abordées sont avant tout d’ordre épistémologique : Peut-on s’attendre à des règles syntaxiques simples et depuis quand cherche-t-on des règles simples  ? Peut-on estimer qu’il y a une infinité de phrases différentes et depuis quand la linguistique tient-elle cette croyance  ?
Pour répondre à ces questions, je puise d’abord dans l’Histoire de la science et de la linguistique et reprends ensuite plusieurs de mes travaux de recherche allant des travaux sur l’ordre des mots, l’analyse statistique de grandes masses de texte, l’analyse syntaxique de corpus oraux jusqu’à la génération de texte dans le domaine de la créativité artificielle. J’explore les résultats de ces recherches dans le but de rendre opérationnel l’apprentissage automatique pour donner une base empirique à la linguistique théorique.