L’assistant individuel
Des spécialistes autonomes dotés de leur propre mémoire, de leurs propres outils et d’une personnalité — chaque assistant IA est un spécialiste autonome.
Cinq composants
Un assistant AIMOS est un spécialiste autonome qui réunit cinq composants clés :
Contrôle le processus de réflexion en phases : Observer, Orienter, Agir — selon le principe OODA.
Base de données SQLite propre avec mémoire à long terme sémantique, épisodique et procédurale.
Collection d’outils spécifiques au domaine : requêtes SQL, appels REST, opérations sur fichiers, fonctions métier.
Canal de communication avec l’utilisateur : Telegram, e-mail, voix ou tableau de bord.
Modèle local via runtime LLM. L’assistant construit le prompt complet à partir du prompt système, du contexte mémoire et de la demande utilisateur.
Le point essentiel : l’assistant prépare — vous décidez. Votre expertise, votre expérience et votre jugement restent indispensables. L’assistant vous décharge du travail routinier : collecter des données, surveiller des échéances, préparer des brouillons. Le travail d’expertise reste entre vos mains.
Cycle OODA
Un chatbot réagit à chaque message individuellement. Un assistant AIMOS ouvre sa boîte de réception, embrasse l’ensemble, reconnaît les liens — puis agit de manière coordonnée. Le principe sous-jacent : le cycle OODA issu de la théorie de la décision.
Mode réactif
Mode OODA
Thread tg:dupont
Développeur Dupont
« Les tests unitaires pour SG-03 sont terminés. »
Thread email:resp-exig
Responsable Exigences
« TSR-17 a été classé ASIL D. »
Thread int:resp-tests
Responsable Tests
« Le test d’intégration pour SG-03 échoue. »
ÉTAT DES LIEUX (inter-threads)
« Les trois messages concernent le Safety Goal SG-03. La classification ASIL D de TSR-17 modifie les exigences de vérification : les tests unitaires de Dupont ne suffisent plus (couverture MC/DC requise). L’échec du test d’intégration est un problème de timing distinct. »
→ À Dupont
« Tests terminés, mais la classification ASIL D rend la couverture Statement insuffisante. MC/DC requis. »
→ Au Resp. Exigences
« Classification enregistrée. 3 exigences SW concernées, les tests unitaires doivent être étendus. Analyse d’impact en annexe. »
→ Au Resp. Tests
« Problème de timing, non causé par la classification ASIL. Merci d’envoyer le fichier journal. Le test d’intégration devra être relancé après l’extension des tests unitaires. »
Chaque partie prenante ne reçoit que ce qui la concerne — mais chaque réponse est éclairée par la vue d’ensemble.
L’orchestrateur n’est pas un modèle IA mais du code déterministe. Il pilote le cycle OODA en appelant le LLM plusieurs fois avec des tâches différentes :
L’état des lieux ne vit que pendant un cycle batch. Il n’est pas sauvegardé — cycle suivant, nouvel état des lieux. Les enseignements durables migrent vers la mémoire.
L’assistant connaît la vue d’ensemble, mais la partie prenante A n’apprend rien de la conversation avec la partie prenante B — uniquement les impacts qui la concernent.
L’ordre des phases est déterministe. Le LLM ne peut ni sauter ni mélanger de phase — il reçoit une consigne claire pour chaque phase.
Trois modes
AIMOS connaît trois types d’assistants — de la réponse vocale rapide au collaborateur structuré. Les trois peuvent agir de manière proactive (cronjobs, rappels, relances).
<500ms de latence
Réaction immédiate à l’entrée vocale. Transcription Whisper en parallèle du préchauffage LLM. Réponses courtes et précises.
Réception, commande vocale, requêtes rapides
<5s de latence
Conversation rapide via Telegram, e-mail ou tableau de bord. Mémoire, dossiers clients, délégation aux collègues. Cronjobs pour les rappels proactifs.
Support client, helpdesk, prise de commandes
Batch — Cycle OODA
Consulte sa boîte de réception, embrasse tous les dossiers, reconnaît les liens entre les threads, établit un état des lieux — puis agit de manière coordonnée.
Gestion de processus, conformité, assistance projet
Les trois types disposent de mémoire, de compétences, de connecteurs et peuvent agir de manière proactive. La différence réside dans l’approche : un fil vs. la vue d’ensemble.
3-Tier Memory
Trois types de mémoire, recherche hybride et un cycle Dreaming pour la consolidation.
En phase de repos, l’assistant IA analyse ses conversations par un appel LLM, extrait des faits, met à jour ses notes et listes de tâches, consolide sa mémoire et génère des rapports hebdomadaires.
Comme le cerveau humain pendant le sommeil — l’assistant IA condense les vécus en savoir, supprime les entrées redondantes et renforce les connexions importantes. Résultat : des réponses plus précises avec une consommation de tokens réduite.
Comme le cerveau humain pendant le sommeil, AIMOS consolide les souvenirs en période d’inactivité :
Modèle de langage
Le Large Language Model (LLM) est le moteur de réflexion derrière chaque assistant IA. Il comprend le langage, prend des décisions et pilote les outils — et fonctionne entièrement sur votre propre matériel.
Vos requêtes ne quittent jamais le réseau. Aucun fournisseur cloud ne voit vos données.
Pas de prix au token par requête. Le modèle tourne sans limite sur votre GPU.
Pas de limite API, pas de rate-limiting, aucune dépendance à des services externes.
Pour les tâches complexes : escalade automatique et anonymisée vers un LLM cloud. → Détails PII-Vault
Connexion
L’assistant IA communique via des connecteurs — des interfaces standardisées vers les utilisateurs, les systèmes et les autres assistants IA. De nouveaux connecteurs sont développés en continu et peuvent être ajoutés à tout moment pour votre paysage informatique spécifique.
Texte, messages vocaux, documents. Messages proactifs pour les rappels, alertes et résultats. Shared Listener pour tous les assistants IA.
IMAP/SMTP pour l’envoi et la réception. Surveillance POP3 pour les boîtes entrantes. Format HTML et pièces jointes.
Whisper STT + Piper TTS — entièrement local. Reconnaissance et synthèse vocale dans toutes les langues, sans services cloud.
Accès fichiers aux postes de travail via Tailscale VPN. Dossier partagé pour DXF, PDF, Excel — chiffré et sans ports ouverts.
PostgreSQL, MSSQL, Firebird — exclusivement des requêtes SELECT. Aucun accès en écriture aux données de production. Read-Only by Design.
Connexion API universelle pour ERP, CRM, gestion des stocks. GET, POST, PUT avec authentification configurable.
Architecture de Threads
Chaque conversation reçoit son propre identifiant de thread. L’assistant IA ne voit que le client en cours — peu importe combien tournent en parallèle.
Chaque client reçoit automatiquement son propre thread. L’utilisateur Telegram A ne voit jamais la conversation du client e-mail B.
Un client écrit via Telegram : « Je vous ai envoyé un e-mail. » L’assistant IA trouve le thread e-mail et dispose immédiatement du contexte.
Lorsqu’un assistant délègue une tâche à un collègue, l’identifiant de thread l’accompagne. Le destinataire travaille dans le même contexte client.
Attribution automatique — chaque canal génère le bon identifiant de thread à l’arrivée
Threading e-mail — en-têtes In-Reply-To et References pour une attribution correcte
Fichiers par thread — les pièces jointes sont attribuées au dossier, tous canaux confondus
Isolation au niveau du code — appliquée au niveau de la base de données, indépendamment du modèle IA
Boîte à outils
Chaque assistant IA reçoit exactement les skills dont il a besoin. Des skills personnalisés peuvent être ajoutés à tout moment — pour chaque secteur, chaque système, chaque workflow.
IMAP/SMTP, surveillance POP3. Envoi, réception, pièces jointes, surveillance automatique de la boîte mail.
Texte, messages vocaux, documents. Notifications proactives pour les alertes et résultats.
Whisper STT + Piper TTS — entièrement local. Reconnaissance et synthèse vocale dans toutes les langues.
Lire et envoyer des messages, créer des réunions en ligne.
Rechercher, créer, modifier le statut des tickets, commenter. Requêtes JQL, vue sprint.
Work items, pipelines, boards. Création de tâches, suivi de statut, surveillance CI/CD.
Lire projets et tâches, suivre les jalons, mettre à jour les échéances.
Exigences, cas de test, liens de traçabilité, comparaison de baselines. Pour le développement automobile.
Pages wiki et documents — lire, créer, mettre à jour. Intégration DMS.
Créer des documents Office : rapports en Word, données en Excel, présentations en PowerPoint.
Scanner factures, bons de livraison, contrats. Détection automatique des champs. Traité localement.
Résumés quotidiens et hebdomadaires, export CSV, synthèses automatiques.
Interroger articles, clients, commandes, niveaux de stock. Multi-backend : SAP, DATEV, personnalisé.
PostgreSQL, MSSQL, Firebird — lecture seule par conception. Aucun accès en écriture aux données de production.
Dépôts, merge requests, pipelines CI/CD. Lire les commits, créer des tickets, commenter.
Accès aux fichiers sur les postes de travail via VPN. Chiffré et sans ports ouverts.
Certifications, intervalles de maintenance, durées de contrat. Rappels proactifs avant expiration.
Surveiller les niveaux de stock, suggestions de réapprovisionnement, alertes de quantité minimale.
Rendez-vous, échéances, relances. Envoi d’invitations Outlook. Jours fériés pris en compte automatiquement.
Personnes, entreprises, numéros de téléphone, adresses e-mail. Mise à jour automatique.
Boîte à outils modulaire : Chaque assistant IA ne reçoit que les skills dont il a besoin. Les intégrations personnalisées (systèmes ERP spécifiques, outils sectoriels, bases de données internes) peuvent être développées et ajoutées comme nouveaux skills à tout moment — sans modifier le noyau.