Tarifs — AIMOS

Prestations ponctuelles

Mise en place & Intégration

Du conseil matériel jusqu'à la mise en production.

Prestation	Description	Prix (HT)
Conseil matériel	Recommandation GPU, spécification serveur, accompagnement à l'achat	600 – 1.800 EUR
Installation SovereignNode	Système d'exploitation, AIMOS, runtime LLM (SGLang), PostgreSQL, SSL, VPN (Tailscale), pare-feu	2.500 – 5.000 EUR
Premier agent (sur mesure)	Prompt système, personnalité, compétences, connecteurs, tests avec données réelles	1.800 – 3.600 EUR
Chaque agent supplémentaire	Configuration, compétences, connecteurs, tests	1.000 – 1.800 EUR
Intégration ERP / CRM	Mapping SQL, connexion API, tests avec données de production (par système)	1.200 – 3.600 EUR
Intégration CAO / Documents	AutoCAD, Tekla, PDF, formats Office — lecture, analyse, nomenclatures	1.200 – 3.600 EUR
Migration d'agents	Migrer les agents de notre serveur vers votre SovereignNode (mémoire incluse)	600 – 1.200 EUR

Projet initial typique : SovereignNode + 2 agents + 1 connexion ERP = 8.000 – 15.000 EUR. Le budget PoC (2.500 EUR) est intégralement déduit.

Maintenance mensuelle

Support & Évolution

Optionnel, mais recommandé. AIMOS fonctionne également sans contrat de maintenance — c'est votre logiciel.

Basique

350 EUR/mois

Engagement minimum de 12 mois

Mises à jour logicielles & correctifs de sécurité
Surveillance système (accès au tableau de bord)
Support par e-mail (délai de réponse 48h)
Rapport mensuel de consommation de tokens

Demander

Standard

recommandé

650 EUR/mois

Engagement minimum de 12 mois

Tout le contenu de Basique
Ajustements des agents (prompts, compétences, connecteurs)
Support Telegram (délai de réponse 24h)
Évaluation et déploiement de nouveaux modèles LLM
Jusqu'à 2h de développement par mois incluses

Demander

Premium

1.200 EUR/mois

Engagement minimum de 6 mois

Tout le contenu de Standard
Délai de réponse 4h (heures ouvrables)
Appel de revue mensuel (60 min)
Jusqu'à 5h de développement par mois incluses
Nouveaux agents & compétences inclus

Demander

Prestations flexibles

Taux horaires

Pour les besoins spécifiques en dehors des forfaits.

150 EUR

par heure (HT)

Développement

Nouvelles compétences, connecteurs, agents, prompts système, connexions ERP

180 EUR

par heure (HT)

Formation

Ateliers à distance pour votre équipe : tableau de bord, gestion des agents, bonnes pratiques

220 EUR

par heure (HT)

Support d'urgence

En dehors des heures ouvrables, week-ends, jours fériés

La vraie question

Quel est le coût de ne rien changer ?

AIMOS n'est pas un chatbot. C'est un système autonome qui prend en charge les tâches répétitives que vos collaborateurs effectuent manuellement aujourd'hui — 24 heures sur 24.

Aujourd'hui : Manuel

Requêtes comptables

Un employé recherche soldes, factures, statuts de paiement dans le système ERP

Temps par requête ~15 min/requête

Requêtes/jour ~20

Temps de travail/jour ~5 heures

Coût personnel/mois ~2.500 EUR

Uniquement pendant les heures de bureau. Congés/maladie = interruption.

Aujourd'hui : Manuel

Réponses aux clients

Un collaborateur répond aux demandes par e-mail, téléphone, messagerie

Temps par demande ~10 min/demande

Demandes/jour ~15

Temps de travail/jour ~2,5 heures

Coût personnel/mois ~1.200 EUR

Délai de réponse variable. Le savoir-faire se perd lors d'un changement de personnel.

Avec AIMOS

Les deux automatisés

L'agent AIMOS répond instantanément, interroge l'ERP, connaît l'historique

Temps de réponse 3–10 secondes

Disponibilité 24/7/365

Conservation du savoir Permanente

Maintenance AIMOS/mois 350–650 EUR

Pas de congés, pas d'arrêts maladie, aucune perte de savoir-faire. Vos collaborateurs sont libérés pour des tâches plus exigeantes.

L'objectif n'est pas de remplacer vos collaborateurs.

AIMOS prend en charge les tâches répétitives qui occupent aujourd'hui des collaborateurs qualifiés en dessous de leur valeur : consulter des soldes, répondre aux demandes standard, résumer des documents, suivre des rendez-vous. Vos collaborateurs gagnent du temps pour ce pourquoi vous les avez embauchés — relations clients, décisions, travail créatif.

L'agent AIMOS dispose d'une mémoire permanente : il connaît chaque client, chaque préférence, chaque dossier en cours. Lorsqu'un collaborateur quitte l'entreprise, le savoir reste — dans l'agent.

Matériel

Le SovereignNode

AIMOS fonctionne sur un seul serveur équipé d'un GPU NVIDIA. Pas de cloud, pas de coûts de calcul mensuels. Le matériel vous appartient.

Configuration recommandée

Acquisition unique — à partir d'env. 5.000 EUR

~5.000 EUR

GPU

NVIDIA RTX 5090

32 Go GDDR7 — env. 2.500 EUR

CPU

16+ cœurs

AMD Ryzen 9 / Intel i7

RAM

64 Go DDR5

Pour modèle d'embedding + BDD

Stockage

1 To NVMe SSD

Modèles + bases de données + journaux

Système d'exploitation : Ubuntu 26.04 LTS (recommandé) ou 24.04 LTS. Consommation électrique : ~170W en moyenne, env. 45 EUR/mois.

Que peut faire un SovereignNode ?

Qwen 3.5:27B sur RTX 5090 — env. 40 tokens/s en sortie, ~500 tokens/s pour le traitement des prompts

Utilisation légère

1–2 agents

Assistant unique, requêtes occasionnelles

Appels LLM/jour ~30

Tokens/jour ~130.000

Tokens/mois ~4 Mio.

Charge GPU <5%

Utilisation typique

3–5 agents

Plusieurs départements, conversations régulières

Appels LLM/jour ~100

Tokens/jour ~500.000

Tokens/mois ~15 Mio.

Charge GPU ~10%

Utilisation intensive

5–10 agents

Entreprise entière, nombreuses conversations, chaînes d'outils

Appels LLM/jour ~300

Tokens/jour ~1,9 Mio.

Tokens/mois ~57 Mio.

Charge GPU ~35%

Que signifient ces chiffres ?

Un token est la plus petite unité de traitement du modèle de langage — approximativement un mot ou un fragment de mot. Un message Telegram typique comprend 30–100 tokens, une réponse détaillée de l'agent 100–300 tokens.

Par interaction avec un agent, le système traite environ 4.000–6.000 tokens (prompt système + mémoire + historique de conversation + réponse). Avec 100 interactions par jour, cela représente environ 500.000 tokens — le GPU n'est alors utilisé qu'à 10%.

Même en utilisation intensive avec 10 agents, 65% de la capacité GPU reste disponible. Un SovereignNode est largement dimensionné pour l'ensemble des PME. L'IA attend vos collaborateurs — pas l'inverse.

Aucun coût de calcul récurrent : contrairement à l'IA cloud, vous ne payez pas au token. Après l'acquisition unique du matériel (~5.000 EUR), seuls les coûts d'électricité d'environ 45 EUR/mois s'appliquent — quel que soit le nombre de tokens traités par vos agents.

Remarques importantes

• Tous les prix sont hors taxes (HT), TVA en sus.
• Valable pour les clients au sein de l'Union européenne. Toutes les prestations sont fournies à distance (SSH, Telegram, visioconférence).
• Les interventions sur site (installation, formation, atelier) sont possibles et facturées individuellement selon la charge de travail (frais de déplacement + tarif journalier).
• Le matériel n'est pas inclus dans le prix. Un SovereignNode (serveur avec GPU NVIDIA) est acquis par le client. Nous vous accompagnons dans le choix.
• AIMOS est sous licence MIT. Vous pouvez également utiliser, adapter et redistribuer le logiciel de manière autonome, sans contrat de service.
• Prix valables à partir d'avril 2026. Sous réserve de modifications.

Licences Open Source des composants

AIMOS repose sur une pile de composants entièrement open source. Aucune dépendance propriétaire, aucun coût de licence caché.

Composant	Fonction	Licence
AIMOS	Plateforme multi-agents	MIT
Qwen 3.5 (Alibaba)	Modèle de langage (LLM, 27B paramètres)	Apache 2.0
SGLang	Runtime LLM avec RadixAttention (cache de préfixes)	Apache 2.0
Faster-Whisper	Reconnaissance vocale (Speech-to-Text)	MIT
OpenAI Whisper (Modèle)	Modèle vocal Whisper Medium	MIT
Piper TTS	Synthèse vocale (Text-to-Speech)	MIT
Sentence-Transformers	Modèle d'embedding pour la recherche sémantique	Apache 2.0
PostgreSQL	Base de données relationnelle (Relay + Config)	PostgreSQL License (BSD)
SQLite	Mémoire des agents (par agent)	Public Domain
FastAPI / Uvicorn	Serveur web du tableau de bord	MIT / BSD
Python	Langage de programmation	PSF License (BSD)
Ubuntu Linux	Système d'exploitation	GPL v2 (gratuit)
NVIDIA CUDA Toolkit	Pilotes GPU & pile de calcul	NVIDIA EULA (gratuit, propriétaire)
Tailscale	VPN pour accès à distance (optionnel)	BSD / gratuit pour ≤3 utilisateurs

Seul composant non open source : les pilotes NVIDIA CUDA (gratuits, mais propriétaires). Tous les autres composants sont entièrement Open Source avec des licences permissives. Aucun frais de licence, aucune restriction d'utilisation, aucun verrouillage fournisseur.

Transparent. Équitable.
Aucun coût caché.

Proof of Concept

Mise en place & Intégration

Support & Évolution

Basique

Standard

Premium

Taux horaires

Développement

Formation

Support d'urgence

Quel est le coût de ne rien changer ?

Requêtes comptables

Réponses aux clients

Les deux automatisés

L'objectif n'est pas de remplacer vos collaborateurs.

Le SovereignNode

Configuration recommandée

Que peut faire un SovereignNode ?

1–2 agents

3–5 agents

5–10 agents

Que signifient ces chiffres ?

Remarques importantes

Licences Open Source des composants

Prêt pour votre projet pilote ?

Transparent. Équitable. Aucun coût caché.

Proof of Concept

Mise en place & Intégration

Support & Évolution

Basique

Standard

Premium

Taux horaires

Développement

Formation

Support d'urgence

Quel est le coût de ne rien changer ?

Requêtes comptables

Réponses aux clients

Les deux automatisés

L'objectif n'est pas de remplacer vos collaborateurs.

Le SovereignNode

Configuration recommandée

Que peut faire un SovereignNode ?

1–2 agents

3–5 agents

5–10 agents

Que signifient ces chiffres ?

Remarques importantes

Licences Open Source des composants

Prêt pour votre projet pilote ?

Transparent. Équitable.
Aucun coût caché.