Vos documents contiennent une expertise précieuse, mais ils restent trop souvent inaccessibles : enfouis dans des PDF, éparpillés sur votre site, connus de quelques personnes seulement. XooMind les indexe, les comprend et les rend interrogeables en langage naturel, par vos équipes comme par vos visiteurs.
XooMind ingère l'ensemble de vos contenus (PDF, pages web, guides, textes réglementaires) et les transforme en une base de connaissance intelligente, interrogeable en langage naturel. Contrairement à un moteur de recherche classique, XooMind comprend le sens des questions posées et retrouve les informations pertinentes, même formulées différemment.
La base se met à jour automatiquement à chaque modification de vos documents, sans intervention manuelle.
XooMind opère sur deux axes :
Il alimente XooMate, l'assistant conversationnel visible sur votre site, capable de répondre 24h/24 aux questions de vos visiteurs sur la base de vos vrais contenus.
À chaque demande de contact entrante, XooMind génère automatiquement un brouillon de réponse contextualisé. Vos collaborateurs le retrouvent dans l'interface d'administration, le relisent, l'ajustent si nécessaire et l'envoient en un clic.
XooMind peut également s'intégrer directement dans le backoffice de votre site comme assistant interne (déjà disponible sur les sites motorisés avec Xooloop CMS). Vos collaborateurs posent leurs questions en langage naturel et obtiennent des réponses précises, fondées sur vos propres documents : textes de loi, procédures internes, fiches produits, guides métier. Un avantage décisif par rapport à un assistant généraliste comme ChatGPT, Gemini ou Mistral : XooMind ne devine pas, il sait. Il connaît votre activité, votre vocabulaire, vos spécificités parce qu'il a été nourri exclusivement par vos contenus.
XooMind dispose d'une interface d'administration complète :
XooMind identifie automatiquement les questions auxquelles vos documents ne permettent pas de répondre (les "trous documentaires") : ces lacunes vous sont remontées régulièrement pour enrichir votre base au fil du temps.
Un rapport mensuel synthétise l'activité : volume de questions, thématiques les plus demandées, temps de réponse et satisfaction globale.
Vos documents bruts ne quittent jamais votre serveur. Seuls transitent vers les APIs externes les fragments de texte strictement nécessaires à la recherche (Mistral Embed) et à la génération de réponse (Claude Haiku / Anthropic), jamais l'intégralité de vos contenus.
L'ensemble de la base de connaissance, des conversations et des logs reste hébergé sur le serveur XooMind, localisé en France chez OVH par défaut, ou sur tout autre serveur de votre choix.
XooMate est l'agent IA conversationnel visible par vos visiteurs sur votre site. C'est XooMind qui lui fournit les réponses, basées sur vos vrais documents.
Discutons de votre projet et de vos documents existants.
Nous contacterXooMind est un moteur RAG (Retrieval-Augmented Generation) développé en PHP natif, sans framework, déployable sur n'importe quel serveur (VPS conseillé) ou en local. L'architecture est multi-tenant : une seule codebase, N clients isolés par client_id, avec option de base de données séparée pour les données sensibles (santé, juridique).
pdftotext (poppler-utils)Les contenus sont découpés en chunks de ~2000 caractères avec overlap de 10% (paramétrable selon le type de projet), puis vectorisés par lot via l'API Mistral Embed. Les vecteurs sont stockés en JSON dans MySQL : solution légère sans infrastructure spécialisée, suffisante pour la grande majorité des projets. Les déploiements à volume élevé pourront migrer vers pgvector (PostgreSQL) sans modification du code métier.
La détection des changements repose sur un hash MD5 par fichier : seuls les documents modifiés sont réindexés. La synchronisation est automatique depuis Xooloop CMS à chaque modification ou publication de contenu.
La recherche sémantique s'effectue par similarité cosinus directement en SQL. Les chunks les plus pertinents sont injectés dans un prompt système envoyé à Claude Haiku (Anthropic API), qui génère la réponse finale. Chaque échange est intégralement loggé : tokens consommés, score cosinus, temps de réponse.