ScienQuest, une plateforme pour l’exploration en ligne de corpus arborés
Lien : https://corpora.aiakide.net/scientext20/
ScienQuest est une plateforme en ligne de consultation de corpus arborés, développée au départ par Achille Falaise (LIDILEM, Université Grenoble Alpes) pour le corpus Scientext, maintenant élargie à d’autres corpus.
Cette plateforme permet de rechercher des motifs textuels, basés sur des séquences de formes, de lemmes, de parties du discours, mais aussi les relations/dépendances syntaxiques entre les mots, grâce à un assistant de requête simple et convivial, élaboré avec des utilisateurs.
Les résultats de recherche sont présentés sous formes de concordances et de statistiques simples (fréquence des formes, lemmes et parties du discours, répartition des occurrences dans le corpus en fonction du type de texte, etc.), et peuvent être exportés vers un tableur.
Plusieurs corpus de données sont disponibles sur ScienQuest. Il convient donc de choisir un corpus en fonction de la langue et du genre textuel que l’on souhaite étudier. Pour chaque corpus, est indiqué un court descriptif, le nombre de textes et de mots qu’il contient, ainsi que le logiciel ayant servi à l’analyse.
Accueil > Actualités > Actualités de l’association > ScienQuest, une plateforme pour l’exploration en ligne de corpus arborés