Tarifs

Transparent. Équitable.
Aucun coût caché.

Aucun frais de licence pour le logiciel. Vous ne payez que la mise en place, l'intégration et la maintenance optionnelle. AIMOS est et restera Open Source.

Démarrage

Proof of Concept

2.500 EUR

paiement unique, intégralement déduit en cas de commande

AIMOS installé sur votre matériel ou temporairement sur le nôtre
1 agent configuré individuellement pour votre cas d'usage principal
2 semaines de test avec vos données réelles
Rapport final avec recommandation pour le déploiement
Aucun risque : si vous n'êtes pas convaincu, aucun coût supplémentaire
Demander un PoC

Prestations ponctuelles

Mise en place & Intégration

Du conseil matériel jusqu'à la mise en production.

Prestation Description Prix (HT)
Conseil matériel Recommandation GPU, spécification serveur, accompagnement à l'achat 600 – 1.800 EUR
Installation SovereignNode Système d'exploitation, AIMOS, runtime LLM (SGLang), PostgreSQL, SSL, VPN (Tailscale), pare-feu 2.500 – 5.000 EUR
Premier agent (sur mesure) Prompt système, personnalité, compétences, connecteurs, tests avec données réelles 1.800 – 3.600 EUR
Chaque agent supplémentaire Configuration, compétences, connecteurs, tests 1.000 – 1.800 EUR
Intégration ERP / CRM Mapping SQL, connexion API, tests avec données de production (par système) 1.200 – 3.600 EUR
Intégration CAO / Documents AutoCAD, Tekla, PDF, formats Office — lecture, analyse, nomenclatures 1.200 – 3.600 EUR
Migration d'agents Migrer les agents de notre serveur vers votre SovereignNode (mémoire incluse) 600 – 1.200 EUR

Projet initial typique : SovereignNode + 2 agents + 1 connexion ERP = 8.000 – 15.000 EUR. Le budget PoC (2.500 EUR) est intégralement déduit.

Maintenance mensuelle

Support & Évolution

Optionnel, mais recommandé. AIMOS fonctionne également sans contrat de maintenance — c'est votre logiciel.

Basique

350 EUR/mois

Engagement minimum de 12 mois

  • Mises à jour logicielles & correctifs de sécurité
  • Surveillance système (accès au tableau de bord)
  • Support par e-mail (délai de réponse 48h)
  • Rapport mensuel de consommation de tokens
Demander

Standard

recommandé
650 EUR/mois

Engagement minimum de 12 mois

  • Tout le contenu de Basique
  • Ajustements des agents (prompts, compétences, connecteurs)
  • Support Telegram (délai de réponse 24h)
  • Évaluation et déploiement de nouveaux modèles LLM
  • Jusqu'à 2h de développement par mois incluses
Demander

Premium

1.200 EUR/mois

Engagement minimum de 6 mois

  • Tout le contenu de Standard
  • Délai de réponse 4h (heures ouvrables)
  • Appel de revue mensuel (60 min)
  • Jusqu'à 5h de développement par mois incluses
  • Nouveaux agents & compétences inclus
Demander

Prestations flexibles

Taux horaires

Pour les besoins spécifiques en dehors des forfaits.

150 EUR
par heure (HT)

Développement

Nouvelles compétences, connecteurs, agents, prompts système, connexions ERP

180 EUR
par heure (HT)

Formation

Ateliers à distance pour votre équipe : tableau de bord, gestion des agents, bonnes pratiques

220 EUR
par heure (HT)

Support d'urgence

En dehors des heures ouvrables, week-ends, jours fériés

La vraie question

Quel est le coût de ne rien changer ?

AIMOS n'est pas un chatbot. C'est un système autonome qui prend en charge les tâches répétitives que vos collaborateurs effectuent manuellement aujourd'hui — 24 heures sur 24.

Aujourd'hui : Manuel

Requêtes comptables

Un employé recherche soldes, factures, statuts de paiement dans le système ERP

Temps par requête ~15 min/requête
Requêtes/jour ~20
Temps de travail/jour ~5 heures
Coût personnel/mois ~2.500 EUR

Uniquement pendant les heures de bureau. Congés/maladie = interruption.

Aujourd'hui : Manuel

Réponses aux clients

Un collaborateur répond aux demandes par e-mail, téléphone, messagerie

Temps par demande ~10 min/demande
Demandes/jour ~15
Temps de travail/jour ~2,5 heures
Coût personnel/mois ~1.200 EUR

Délai de réponse variable. Le savoir-faire se perd lors d'un changement de personnel.

Avec AIMOS

Les deux automatisés

L'agent AIMOS répond instantanément, interroge l'ERP, connaît l'historique

Temps de réponse 3–10 secondes
Disponibilité 24/7/365
Conservation du savoir Permanente
Maintenance AIMOS/mois 350–650 EUR

Pas de congés, pas d'arrêts maladie, aucune perte de savoir-faire. Vos collaborateurs sont libérés pour des tâches plus exigeantes.

L'objectif n'est pas de remplacer vos collaborateurs.

AIMOS prend en charge les tâches répétitives qui occupent aujourd'hui des collaborateurs qualifiés en dessous de leur valeur : consulter des soldes, répondre aux demandes standard, résumer des documents, suivre des rendez-vous. Vos collaborateurs gagnent du temps pour ce pourquoi vous les avez embauchés — relations clients, décisions, travail créatif.

L'agent AIMOS dispose d'une mémoire permanente : il connaît chaque client, chaque préférence, chaque dossier en cours. Lorsqu'un collaborateur quitte l'entreprise, le savoir reste — dans l'agent.

Matériel

Le SovereignNode

AIMOS fonctionne sur un seul serveur équipé d'un GPU NVIDIA. Pas de cloud, pas de coûts de calcul mensuels. Le matériel vous appartient.

Configuration recommandée

Acquisition unique — à partir d'env. 5.000 EUR

~5.000 EUR
GPU
NVIDIA RTX 5090
32 Go GDDR7 — env. 2.500 EUR
CPU
16+ cœurs
AMD Ryzen 9 / Intel i7
RAM
64 Go DDR5
Pour modèle d'embedding + BDD
Stockage
1 To NVMe SSD
Modèles + bases de données + journaux

Système d'exploitation : Ubuntu 26.04 LTS (recommandé) ou 24.04 LTS. Consommation électrique : ~170W en moyenne, env. 45 EUR/mois.

Que peut faire un SovereignNode ?

Qwen 3.5:27B sur RTX 5090 — env. 40 tokens/s en sortie, ~500 tokens/s pour le traitement des prompts

Utilisation légère

1–2 agents

Assistant unique, requêtes occasionnelles

Appels LLM/jour ~30
Tokens/jour ~130.000
Tokens/mois ~4 Mio.
Charge GPU <5%
Utilisation typique

3–5 agents

Plusieurs départements, conversations régulières

Appels LLM/jour ~100
Tokens/jour ~500.000
Tokens/mois ~15 Mio.
Charge GPU ~10%
Utilisation intensive

5–10 agents

Entreprise entière, nombreuses conversations, chaînes d'outils

Appels LLM/jour ~300
Tokens/jour ~1,9 Mio.
Tokens/mois ~57 Mio.
Charge GPU ~35%

Que signifient ces chiffres ?

Un token est la plus petite unité de traitement du modèle de langage — approximativement un mot ou un fragment de mot. Un message Telegram typique comprend 30–100 tokens, une réponse détaillée de l'agent 100–300 tokens.

Par interaction avec un agent, le système traite environ 4.000–6.000 tokens (prompt système + mémoire + historique de conversation + réponse). Avec 100 interactions par jour, cela représente environ 500.000 tokens — le GPU n'est alors utilisé qu'à 10%.

Même en utilisation intensive avec 10 agents, 65% de la capacité GPU reste disponible. Un SovereignNode est largement dimensionné pour l'ensemble des PME. L'IA attend vos collaborateurs — pas l'inverse.

Aucun coût de calcul récurrent : contrairement à l'IA cloud, vous ne payez pas au token. Après l'acquisition unique du matériel (~5.000 EUR), seuls les coûts d'électricité d'environ 45 EUR/mois s'appliquent — quel que soit le nombre de tokens traités par vos agents.

Remarques importantes

  • Tous les prix sont hors taxes (HT), TVA en sus.
  • Valable pour les clients au sein de l'Union européenne. Toutes les prestations sont fournies à distance (SSH, Telegram, visioconférence).
  • Les interventions sur site (installation, formation, atelier) sont possibles et facturées individuellement selon la charge de travail (frais de déplacement + tarif journalier).
  • Le matériel n'est pas inclus dans le prix. Un SovereignNode (serveur avec GPU NVIDIA) est acquis par le client. Nous vous accompagnons dans le choix.
  • AIMOS est sous licence MIT. Vous pouvez également utiliser, adapter et redistribuer le logiciel de manière autonome, sans contrat de service.
  • Prix valables à partir d'avril 2026. Sous réserve de modifications.

Licences Open Source des composants

AIMOS repose sur une pile de composants entièrement open source. Aucune dépendance propriétaire, aucun coût de licence caché.

Composant Fonction Licence
AIMOS Plateforme multi-agents MIT
Qwen 3.5 (Alibaba) Modèle de langage (LLM, 27B paramètres) Apache 2.0
SGLang Runtime LLM avec RadixAttention (cache de préfixes) Apache 2.0
Faster-Whisper Reconnaissance vocale (Speech-to-Text) MIT
OpenAI Whisper (Modèle) Modèle vocal Whisper Medium MIT
Piper TTS Synthèse vocale (Text-to-Speech) MIT
Sentence-Transformers Modèle d'embedding pour la recherche sémantique Apache 2.0
PostgreSQL Base de données relationnelle (Relay + Config) PostgreSQL License (BSD)
SQLite Mémoire des agents (par agent) Public Domain
FastAPI / Uvicorn Serveur web du tableau de bord MIT / BSD
Python Langage de programmation PSF License (BSD)
Ubuntu Linux Système d'exploitation GPL v2 (gratuit)
NVIDIA CUDA Toolkit Pilotes GPU & pile de calcul NVIDIA EULA (gratuit, propriétaire)
Tailscale VPN pour accès à distance (optionnel) BSD / gratuit pour ≤3 utilisateurs

Seul composant non open source : les pilotes NVIDIA CUDA (gratuits, mais propriétaires). Tous les autres composants sont entièrement Open Source avec des licences permissives. Aucun frais de licence, aucune restriction d'utilisation, aucun verrouillage fournisseur.

Prêt pour votre projet pilote ?

Nous vous conseillons gratuitement et sans engagement pour trouver la meilleure approche pour votre entreprise.

Obtenir un conseil gratuit