Compression de modèle à haute efficacité pour les grands modèles de langage sur mobile · CRAN - Centre de Recherche en Automatique de Nancy, Doctorat · La Géode