Contexte
Le projet ARCHILANG (Base de données langagières) est né du besoin urgent de centraliser, structurer et rendre accessibles les données linguistiques, langagières existantes sur les langues du Sénégal. Malgré l’abondance de travaux (corpus, lexiques, descriptions grammaticales), ces ressources restent souvent dispersées, inaccessibles ou peu exploitables.
Développé au sein de la Faculté des Lettres et Sciences Humaines (FLSH) de l’Université Cheikh Anta Diop de Dakar, ce projet vise à établir une plateforme numérique de référence pour les chercheurs, des enseignants, des étudiants et de toute personne intéressée par la richesse linguistique du pays.
Objectifs
- Répertorier les langues nationales du Sénégal ayant fait l’objet d’études linguistiques.
- Centraliser les données linguistiques disponibles (corpus, lexiques, ressources terminologiques, etc.).
- Rendre ces données accessibles à travers un portail ergonomique et interrogeable.
- Faciliter la recherche linguistique, en permettant des requêtes complexes et des analyses croisées.
- Identifier les lacunes documentaires afin d’orienter les futures recherches.
- Promouvoir les langues nationales dans les domaines spécialisés (médical, juridique, éducation, etc.).
Méthodologie
Le portail ArchiLangue est organisé autour de plusieurs bases thématiques correspondant à différents types de données :
- ArchiCorp : Corpus textuels ou oraux, écrits ou retranscrits.
- ArchiLex : Données lexicales issues de dictionnaires unilingues ou bilingues.
- ArchiTerm : Terminologies dans des domaines spécialisés (santé, droit, éducation…).
- ArchiMorph,
- ArchiSynt, ArchiPragSem, ArchiPhon : Bases descriptives couvrant la morphologie, la syntaxe, la sémantique, la phonologie…
Chaque base dispose de champs de saisie spécifiques, permettant une indexation fine, facilitant la recherche, l’analyse et la comparaison entre langues.
Les données sont collectées à partir de sources fiables (ouvrages, mémoires, transcriptions, corpus existants) et sont progressivement enrichies.
Des outils sont également intégrés pour :
- Rechercher des mots ou expressions par langue ou domaine,
- Explorer les corpus (avec possibilité de télécharger ou écouter les documents),
- Visualiser les relations linguistiques (formes, sens, usage).
Le projet est conçu pour être collaboratif et évolutif, avec une ouverture aux contributions futures et une volonté d’interopérabilité avec d’autres bases linguistiques internationales.