Rachel Panckhurst, de l'université Paul-Valéry Montpellier 3, laboratoire Praxiling, UMR 5267 CNRS, ainsi que ses collègues linguistes et informaticiens, ont recueilli plus de 90 000 SMS en langue française à Montpellier en 2011.
Dans cette conférence, elle évoquera l’organisation et le déroulement de la collecte de SMS dans le cadre du
projet sud4science Languedoc-Roussillon, lui-même intégré dans le
projet international sms4science (Fairon et al. 2006).
Puis, elle présentera la suite du projet, jusqu’au dépôt du corpus, 88milSMS, sur la
grille de services d’Huma-Num en juin 2014 (Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), puis sur
Ortolang en 2016, tout en expliquant pourquoi, dans une démarche pluridisciplinaire (située entre sciences du langage, informatique et traitement automatique des langues, TAL), l’équipe de chercheurs a décidé de fournir à la communauté scientifique et au grand public le corpus de SMS.
Elle terminera par quelques applications envisageables en TAL.