• +243 97 260 7501
  • infos@unhorizons.org
  • 2465, Route Kasapa, Quartier Gambela, Lubumbashi

Design and development of an LLM-based chatbot as anoutreach tool for the Congolese legal system

Tshabu Ngandu Bernard, Antoine Bagula & Landry Mbale

Résumé

Ce projet propose la conception et le développement d’un chatbot innovant basé sur un Large Language Model (LLM) pour faciliter l’accès aux connaissances juridiques en République Démocratique du Congo. Grâce à l’utilisation d’une architecture Retrieval-Augmented Generation (RAG) et d’une application web (Juro), le chatbot vise à simplifier le langage juridique complexe pour le rendre compréhensible à tous, y compris aux non-initiés.

Les contributions majeures incluent :

  1. Collecte de données structurées : Développement d’une architecture de web scraping pour collecter et organiser systématiquement les documents juridiques congolais, constituant ainsi le premier jeu de données structuré dans ce domaine.
  2. Flexibilité de l’architecture RAG : Conception d’une architecture permettant l’interchangeabilité des modèles d’embedding et de langage, offrant la possibilité de tester et d’intégrer divers modèles pour optimiser les performances du chatbot.
  3. Fiabilité des réponses : Mise en place d’un mécanisme de citation des sources dans les réponses générées pour garantir la traçabilité et la crédibilité des informations fournies.
  4. Adaptabilité multidomaine : Une architecture conçue pour s’étendre à d’autres secteurs nécessitant la vulgarisation et l’accessibilité d’informations complexes.

Les résultats montrent que les réponses générées sont globalement pertinentes et adaptées au contexte juridique congolais, surpassant parfois les modèles d’entreprise bien qu’elles puissent souffrir de quelques incohérences liées à des nuances légales spécifiques. L’évaluation qualitative a révélé que les utilisateurs trouvent les réponses utiles malgré une latence légèrement accrue, attribuable à une infrastructure serveur encore perfectible.

Mots-clés : Chatbot, Large Language Model (LLM), Système Juridique Congolais, Vulgarisation, Accessibilité à l’Information, Intelligence Artificielle, Retrieval-Augmented Generation.