Bibliographie
Le laboratoire MoDyCo - UMR 7114 - CNRS / École doctorale 139/ Université Paris Nanterre / organise sa 13ème édition du Coldoc. Il s’agit d’un colloque annuel organisé par ses doctorants et jeunes chercheurs en Sciences du Langage. La présente édition de ce colloque s’intitule "Fondements empiriques de la linguistique : données de corpus, données expérimentales. Quelles données pour le linguiste ?" et aura lieu à l’Université Paris Nanterre les 27 et 28 novembre 2019. Le site du colloque : https://coldoc2019.frama.site/.
Adresse de contact : coldoc2019@gmail.com
DATE LIMITE DE SOUMISSION : le 2 juin 2019
=========================================================
COLDOC 2019 - COLLOQUE DE DOCTORANTS ET DE JEUNES CHERCHEURS
MoDyCo UMR 7114 CNRS
Université Paris Nanterre
27 et 28 novembre 2019
Fondements empiriques de la linguistique : données de corpus, données expérimentales. Quelles données pour le linguiste ?
Coldoc est un colloque organisé par les doctorants et jeunes chercheurs en Sciences du langage du laboratoire MoDyCo. Pour sa 13ème édition, Coldoc est centré sur la question des données de la recherche en Science du langage, qu’elles soient collectées dans le cadre d’une linguistique sur corpus ou selon la méthode expérimentale. Nous invitons masterants, doctorants et jeunes chercheurs à venir exposer leurs réflexions sur leurs données de recherche à partir des différentes approches choisies, quel que soit le degré d’avancement de leur recherche. Cet appel à contribution se veut ouvert et cherche à faire dialoguer ces deux approches théoriques afin de s’interroger sur les apports, les limites et la complémentarité possible des données résultant de ces deux traditions scientifiques. Cette question traverse différents niveaux d’analyse de la langue (phonétique/phonologique, morphologique, syntaxique, sémantique, pragmatique), différentes unités (lexicale, discursive), différents canaux sensoriels (visuel, auditif, etc) impliquant langue vocale ou signée et différentes modalités (orale, écrite, multimodale).
Dans le cadre de ce colloque, nous souhaitons faire dialoguer la linguistique sur corpus et l’approche expérimentale, ce qui constitue une des dynamiques fondamentales portées par le laboratoire MoDyCo. Des différences méthodologiques entre les deux approches s’observent entre autres au niveau de la formulation d’une hypothèse avant toute collecte et analyse des données, une démarche préférée par les psycholinguistes et qui demeure minoritaire chez les linguistes travaillant à partir de corpus (Gilquin et Gries, 2009), pour des raisons scientifiques mais aussi pour des raisons techniques. Scheer (2004) parle par exemple de corpus de validation (avec hypothèse préalable) ou de corpus heuristique (sans hypothèse). Pour autant, ces deux approches ne sont pas complètement antagonistes. Plutôt qu’une dichotomie stricte, Gilquin et Gries (2009) proposent un continuum entre les deux approches fondé sur l’écologie des données. Par exemple deux jeux de données expérimentales peuvent se positionner différemment sur ce continuum selon qu’elles sont collectées à partir d’activités plus ou moins habituelles pour le locuteur. Surtout, les apports mutuels de ces données permettent de réactualiser les théories linguistiques. Différentes façons de combiner les deux approches ont pu être envisagées :
1) Le matériel expérimental peut être conçu à partir de données de corpus existantes en les adaptant aux exigences des différents protocoles expérimentaux.
2) Les résultats d’expérimentations peuvent être comparés à des résultats obtenus précédemment sur corpus afin de les valider, nuancer ou infirmer.
3) Les résultats provenant d’analyses de corpus peuvent confirmer, nuancer voire infirmer des résultats provenant d’expérimentations. Par exemple, en phonologie, les données de Liégeois (2014) sur l’acquisition de la liaison valident un modèle théorique fondé sur des données expérimentales.
4) Un linguiste peut encore combiner données de corpus et données expérimentales (ex. De Mönnink, 1997 sur les syntagmes nominaux).
L’ambition de ce colloque est d’apprécier les apports et limites des données collectées par les chercheurs, pour la constitution d’un corpus ou dans un contexte expérimental, dans l’optique de voir comment le choix d’une approche plutôt qu’une autre (analyse de corpus vs approche expérimentale) peut influencer les données de la recherche et les résultats. Plusieurs questions, mentionnées ici sans exhaustivité, peuvent être envisagées comme source d’inspiration :
- Quelles sont les points forts et les limites de vos données issues de corpus ou d’expérimentations ?
- Comment les choix méthodologiques de recueil des données influencent-ils vos recherches (données, résultats) ?
- Quels sont les enjeux méthodologiques communs aux deux approches ? En quoi ont-ils un impact sur vos données ?
- Comment l’expérimentateur peut se servir de données et/ou résultats de corpus ? Comment le linguiste travaillant sur corpus peut se servir des résultats d’expérimentations ?
- Comment les outils pédagogiques ou technologiques, développés au terme de votre recherche à partir de vos données, sont-ils influencés par vos choix méthodologiques ?
Notez que les questions présentées ici ne sont proposées qu’à titre d’exemple : vous pourrez n’en traiter qu’une ou présenter tout travail relevant de la méthodologie de corpus, de la méthodologie expérimentale, ou du lien entre les deux.
Au cours de ce colloque, les contributions des participants seront éclairées par des présentations lors de conférences plénières mettant en relation l’approche expérimentale et l’analyse de corpus, en croisant les différents regards. Nous tenterons d’appréhender comment ces deux approches peuvent éclairer mutuellement une même question de recherche. Nous attendons vos propositions de communications orales, démonstrations (20 minutes + 10 minutes de discussion) ou posters sur les thématiques évoquées. Toute autre proposition portant sur la nature et la place des données ou plus largement sur vos recherches en Sciences du langage est encouragée et sera étudiée. Les propositions, d’une page maximum (hors bibliographie) devront être rédigées en français ou en anglais et devront être déposées sur Easychair (https://easychair.org/conferences/?conf=coldoc2019) avant le 2 juin 2019.
Références :
De Mönnink, Inge. 1997. « Using corpus and experimental data : a multimethod approach ». Language and computers 20 : 227‑44.
Gilquin, Gaëtanelle, et Stefan Th Gries. 2009. « Corpora and experimental methods : A state-of-the-art review ». Corpus Linguistics and Linguistic Theory 5 (1) : 1‑26.
Liégeois, Loïc. 2014. « Usage des variables phonologiques dans un corpus d’interactions naturelles parents-enfant : impact du bain linguistique et dispositifs cognitifs d’apprentissage. » Thèse de doctorat, Clermont Ferrand 2.
Scheer, Tobias. 2004. « Le corpus heuristique : un outil qui montre mais ne démontre pas ». Corpus, 3.
Voir en ligne : Site du Coldoc 2019