XooMind : le moteur IA documentaire

XooMind : le moteur IA documentaire

XooMind - Le moteur IA qui transforme vos documents en base de connaissance vivante

Vos documents contiennent une expertise précieuse, mais ils restent trop souvent inaccessibles : enfouis dans des PDF, éparpillés sur votre site, connus de quelques personnes seulement.

XooMind indexe l'ensemble de vos contenus (PDF, pages web, guides, textes réglementaires) et les transforme en une base de connaissance intelligente, interrogeable en langage naturel.

Contrairement à un moteur de recherche classique, XooMind comprend le sens des questions posées et retrouve les informations pertinentes, même formulées différemment.

La base se met à jour automatiquement à chaque modification de vos documents, sans intervention manuelle.

 

Un assistant au service de vos équipes et de vos visiteurs

XooMind opère sur deux axes :

 

Côté visiteurs

Il alimente XooMate, l'assistant conversationnel visible sur votre site, capable de répondre 24h/24 aux questions de vos visiteurs sur la base de vos vrais contenus.

 

Côté équipe

A chaque demande de contact entrante, XooMind génère automatiquement un brouillon de réponse contextualisé. Vos collaborateurs le retrouvent dans l'interface d'administration, le relisent, l'ajustent si nécessaire et l'envoient en un clic. Vous gagnez du temps sans perdre le contrôle de la relation client.

XooMind peut également s'intégrer directement dans le backoffice de votre site comme assistant interne (déjà prêt sur les sites motorisés avec notre outil Xooloop CMS). Vos collaborateurs posent leurs questions en langage naturel et obtiennent des réponses précises, fondées sur vos propres documents : textes de loi, procédures internes, fiches produits, guides métier... Un avantage décisif par rapport à un assistant généraliste comme ChatGPT, Gemini, Claude ou Mistral : XooMind ne devine pas, il sait. Il connaît votre activité, votre vocabulaire, vos spécificités parce qu'il a été nourri exclusivement par vos contenus.

 

Pilotage et amélioration continue :

XooMind dispose d'une interface d'administration complète :

  • gestion des sources documentaires,
  • validation des brouillons de réponse,
  • consultation des conversations,
  • suivi de la satisfaction visiteurs.

XooMind identifie automatiquement les questions auxquelles vos documents ne permettent pas de répondre (les "trous documentaires") : ces lacunes vous sont remontées régulièrement pour enrichir votre base au fil du temps.

Un rapport mensuel synthétise l'activité : volume de questions, thématiques les plus demandées, temps de réponse et satisfaction globale.

 

Découvrir XooMate, l'assistant pour vos visiteurs

 

Nous contacter pour en savoir plus

 

Sécurité et confidentialité des données :

Vos documents bruts ne quittent jamais votre serveur !

Seuls transitent vers les APIs externes les fragments de texte strictement nécessaires à la recherche (Mistral Embed) et à la génération de réponse (Claude Haiku / Anthropic), jamais l'intégralité de vos contenus.

L'ensemble de la base de connaissance, des conversations et des logs reste hébergé sur le serveur XooMind, localisé en France chez OVH par défaut, ou sur tout autre serveur de votre choix.

 

Stack Technique

Fondations

XooMind est un moteur RAG (Retrieval-Augmented Generation) développé en PHP natif, sans framework, déployable sur n'importe quel serveur (VPS conseillé) ou en local.

L'architecture est multi-tenant : une seule codebase, N clients isolés par client_id, avec option de base de données séparée pour les données sensibles (santé, juridique).

 

Sources de données indexables

XooMind ingère les contenus depuis de nombreuses sources :

  • PDF via pdftotext (poppler-utils)
  • Markdown et texte brut
  • Code source PHP par exploration récursive de dossiers projet
  • Pages web et sites distants par exploration d'une liste d'URL ou parsing de sitemap XML
  • Contenus des sites motorisés par Xooloop CMS via une interface dédiée : définition des modèles à indexer (articles, fiches produits, annuaires...), avec inclusion automatique des PDF liés aux pages
  • Base de données client en temps réel (selon interface prédéfinie et clés d'accès) pour enrichir les réponses avec des données vivantes : stocks, disponibilités, fiches, annuaires...

 

Pipeline d'indexation

Les contenus sont découpés en chunks de ~2000 caractères avec overlap de 10% (paramétrable selon le type de projet), puis vectorisés par lot via l'API Mistral Embed.

Les vecteurs sont stockés en JSON dans MySQL : solution légère sans infrastructure spécialisée, suffisante pour la grande majorité des projets. Les déploiements à volume élevé pourront migrer vers pgvector (PostgreSQL) sans modification du code métier.

La détection des changements repose sur un hash MD5 par fichier : seuls les documents modifiés sont réindexés.

La synchronisation est automatique depuis Xooloop CMS à chaque modification ou publication de contenu.

 

Génération des réponses

La recherche sémantique s'effectue par similarité cosinus directement en SQL.

Les chunks les plus pertinents sont injectés dans un prompt système envoyé à Claude Haiku (Anthropic API), qui génère la réponse finale.

Chaque échange est intégralement loggé : tokens consommés, score cosinus, temps de réponse — pour le suivi, la facturation et l'amélioration continue.

 

 

© 2007-2026 Xooloop.fr :: Mentions légales :: Politique de confidentialité :: Gestion des cookies :: Site v4 :: Motorisé par Xooloop CMS v4.1.2