XooMind Moteur IA documentaire Le moteur IA qui transforme vos documents en base de connaissance vivante

Vos documents contiennent une expertise précieuse, mais ils restent trop souvent inaccessibles : enfouis dans des PDF, éparpillés sur votre site, connus de quelques personnes seulement. XooMind les indexe, les comprend et les rend interrogeables en langage naturel, par vos équipes comme par vos visiteurs.

Une base de connaissance vivante

XooMind ingère l'ensemble de vos contenus (PDF, pages web, guides, textes réglementaires) et les transforme en une base de connaissance intelligente, interrogeable en langage naturel. Contrairement à un moteur de recherche classique, XooMind comprend le sens des questions posées et retrouve les informations pertinentes, même formulées différemment.

La base se met à jour automatiquement à chaque modification de vos documents, sans intervention manuelle.

Au service de vos équipes et de vos visiteurs

XooMind opère sur deux axes :

Côté visiteurs

Il alimente XooMate, l'assistant conversationnel visible sur votre site, capable de répondre 24h/24 aux questions de vos visiteurs sur la base de vos vrais contenus.

Côté équipe

À chaque demande de contact entrante, XooMind génère automatiquement un brouillon de réponse contextualisé. Vos collaborateurs le retrouvent dans l'interface d'administration, le relisent, l'ajustent si nécessaire et l'envoient en un clic.

XooMind peut également s'intégrer directement dans le backoffice de votre site comme assistant interne (déjà disponible sur les sites motorisés avec Xooloop CMS). Vos collaborateurs posent leurs questions en langage naturel et obtiennent des réponses précises, fondées sur vos propres documents : textes de loi, procédures internes, fiches produits, guides métier. Un avantage décisif par rapport à un assistant généraliste comme ChatGPT, Gemini ou Mistral : XooMind ne devine pas, il sait. Il connaît votre activité, votre vocabulaire, vos spécificités parce qu'il a été nourri exclusivement par vos contenus.

Pilotage et amélioration continue

XooMind dispose d'une interface d'administration complète :

Gestion des sources documentaires
Validation des brouillons de réponse
Consultation des conversations
Suivi de la satisfaction visiteurs

XooMind identifie automatiquement les questions auxquelles vos documents ne permettent pas de répondre (les "trous documentaires") : ces lacunes vous sont remontées régulièrement pour enrichir votre base au fil du temps.

Un rapport mensuel synthétise l'activité : volume de questions, thématiques les plus demandées, temps de réponse et satisfaction globale.

🔒

Sécurité et confidentialité des données

Vos documents bruts ne quittent jamais votre serveur. Seuls transitent vers les APIs externes les fragments de texte strictement nécessaires à la recherche (Mistral Embed) et à la génération de réponse (Claude Haiku / Anthropic), jamais l'intégralité de vos contenus.

L'ensemble de la base de connaissance, des conversations et des logs reste hébergé sur le serveur XooMind, localisé en France chez OVH par défaut, ou sur tout autre serveur de votre choix.

XooMind alimente XooMate

XooMate est l'agent IA conversationnel visible par vos visiteurs sur votre site. C'est XooMind qui lui fournit les réponses, basées sur vos vrais documents.

Découvrir XooMate

Prêt à rendre vos documents vraiment utiles ?

Discutons de votre projet et de vos documents existants.

Nous contacter

Stack Technique

Schéma de fonctionnement de XooMind - pipeline RAG

Fondations

XooMind est un moteur RAG (Retrieval-Augmented Generation) développé en PHP natif, sans framework, déployable sur n'importe quel serveur (VPS conseillé) ou en local. L'architecture est multi-tenant : une seule codebase, N clients isolés par client_id, avec option de base de données séparée pour les données sensibles (santé, juridique).

Sources de données indexables

PDF via pdftotext (poppler-utils)
Markdown et texte brut
Code source PHP par exploration récursive de dossiers projet
Pages web et sites distants par liste d'URL ou parsing de sitemap XML
Contenus Xooloop CMS via interface dédiée : choix des modèles à indexer (articles, fiches produits, annuaires...), inclusion automatique des PDF liés aux pages
Base de données client en temps réel (interface prédéfinie et clés d'accès) pour enrichir les réponses avec des données vivantes : stocks, disponibilités, fiches, annuaires...

Pipeline d'indexation

Les contenus sont découpés en chunks de ~2000 caractères avec overlap de 10% (paramétrable selon le type de projet), puis vectorisés par lot via l'API Mistral Embed. Les vecteurs sont stockés en JSON dans MySQL : solution légère sans infrastructure spécialisée, suffisante pour la grande majorité des projets. Les déploiements à volume élevé pourront migrer vers pgvector (PostgreSQL) sans modification du code métier.

La détection des changements repose sur un hash MD5 par fichier : seuls les documents modifiés sont réindexés. La synchronisation est automatique depuis Xooloop CMS à chaque modification ou publication de contenu.

Génération des réponses

La recherche sémantique s'effectue par similarité cosinus directement en SQL. Les chunks les plus pertinents sont injectés dans un prompt système envoyé à Claude Haiku (Anthropic API), qui génère la réponse finale. Chaque échange est intégralement loggé : tokens consommés, score cosinus, temps de réponse.