Prezzi
Nessuna licenza software. Lei paga solo per la configurazione, l’integrazione e la manutenzione opzionale. AIMOS è e resterà Open Source.
pagamento unico, interamente deducibile in caso di incarico
Servizi una tantum
Dalla consulenza hardware alla messa in produzione.
| Servizio | Descrizione | Prezzo (netto) |
|---|---|---|
| Consulenza hardware | Raccomandazione GPU, specifiche server, supporto all’acquisto | 600 – 1.800 EUR |
| Installazione SovereignNode | Sistema operativo, AIMOS, LLM-Runtime (SGLang), PostgreSQL, SSL, VPN (Tailscale), Firewall | 2.500 – 5.000 EUR |
| Primo agente (individuale) | System-Prompt, personalità, skill, connettori, test con dati reali | 1.800 – 3.600 EUR |
| Ogni ulteriore agente | Configurazione, skill, connettori, test | 1.000 – 1.800 EUR |
| Integrazione ERP / CRM | Mapping SQL, connessione API, test con dati di produzione (per sistema) | 1.200 – 3.600 EUR |
| Integrazione CAD / documenti | AutoCAD, Tekla, PDF, formati Office — lettura, analisi, distinte base | 1.200 – 3.600 EUR |
| Migrazione agenti | Migrare agenti dal nostro server al Suo SovereignNode (incl. memoria) | 600 – 1.200 EUR |
Progetto iniziale tipico: SovereignNode + 2 agenti + 1 integrazione ERP = 8.000 – 15.000 EUR. Il budget del PoC (2.500 EUR) viene interamente detratto.
Manutenzione mensile
Opzionale, ma consigliato. AIMOS funziona anche senza contratto di manutenzione — è il Suo software.
Durata minima 12 mesi
Durata minima 12 mesi
Durata minima 6 mesi
Servizi flessibili
Per esigenze individuali al di fuori dei pacchetti.
Nuovi skill, connettori, agenti, system prompt, integrazioni ERP
Workshop remoti per il Suo team: dashboard, gestione agenti, best practice
Al di fuori dell’orario lavorativo, fine settimana, festivi
La vera domanda
AIMOS non è un chatbot. È un sistema autonomo che si fa carico delle attività di routine che oggi i Suoi dipendenti svolgono manualmente — 24 ore su 24.
Un collaboratore cerca saldi, fatture e stati dei pagamenti nell’ERP
Solo durante l’orario d’ufficio. Ferie/malattia = interruzione.
Un collaboratore risponde via e-mail, telefono e messaggistica
Tempi di risposta dipendenti dalla disponibilità. Il know-how si perde con il turnover.
L’agente AIMOS risponde istantaneamente, interroga l’ERP e conosce lo storico
Nessuna ferie, nessuna malattia, nessuna perdita di know-how. I collaboratori sono liberi per compiti di maggior valore.
AIMOS si fa carico delle attività di routine che oggi impegnano collaboratori qualificati al di sotto del loro potenziale: consultare saldi, rispondere a richieste standard, riassumere documenti, monitorare appuntamenti. I Suoi dipendenti guadagnano tempo per ciò per cui li ha assunti — relazioni con i clienti, decisioni, lavoro creativo.
L’agente AIMOS ha una memoria permanente: conosce ogni cliente, ogni preferenza, ogni pratica aperta. Quando un dipendente lascia l’azienda, il know-how resta — nell’agente.
Hardware
AIMOS funziona su un singolo server con GPU NVIDIA. Nessun cloud, nessun costo di calcolo mensile. L’hardware è Suo.
Acquisto unico — a partire da ca. 5.000 EUR
Sistema operativo: Ubuntu 26.04 LTS (consigliato) o 24.04 LTS. Consumo energetico: ~170 W in media, ca. 45 EUR/mese.
Qwen 3.5:27B su RTX 5090 — ca. 40 token/s in uscita, ~500 token/s di elaborazione prompt
Assistente singolo, interrogazioni occasionali
Più reparti, conversazioni regolari
Tutta l’azienda, molte conversazioni, catene di strumenti
Un token è l’unità minima di elaborazione del modello linguistico — approssimativamente una parola o parte di essa. Un messaggio Telegram tipico comprende 30–100 token; una risposta dettagliata dell’agente 100–300 token.
Per ogni interazione, il sistema elabora ca. 4.000–6.000 token (system prompt + memoria + cronologia conversazione + risposta). Con 100 interazioni al giorno, ciò corrisponde a ca. 500.000 token — la GPU è utilizzata solo al 10%.
Anche con un utilizzo intensivo di 10 agenti, resta un 65% di capacità GPU libera. Un SovereignNode è più che sufficiente per tutta la media impresa. L’IA aspetta i Suoi collaboratori — non il contrario.
Nessun costo di calcolo ricorrente: a differenza dell’IA cloud, Lei non paga per token. Dopo l’acquisto unico dell’hardware (~5.000 EUR), i soli costi sono quelli dell’elettricità, ca. 45 EUR/mese — indipendentemente da quanti token elaborano i Suoi agenti.
AIMOS si basa su uno stack completamente open source. Nessuna dipendenza proprietaria, nessun costo di licenza nascosto.
| Componente | Funzione | Licenza |
|---|---|---|
| AIMOS | Piattaforma multi-agente | MIT |
| Qwen 3.5 (Alibaba) | Modello linguistico (LLM, 27B parametri) | Apache 2.0 |
| SGLang | Runtime LLM con RadixAttention (cache dei prefissi) | Apache 2.0 |
| Faster-Whisper | Riconoscimento vocale (Speech-to-Text) | MIT |
| OpenAI Whisper (modello) | Modello vocale Whisper Medium | MIT |
| Piper TTS | Sintesi vocale (Text-to-Speech) | MIT |
| Sentence-Transformers | Modello di embedding per ricerca semantica | Apache 2.0 |
| PostgreSQL | Database relazionale (Relay + Config) | PostgreSQL License (BSD) |
| SQLite | Memoria dell’agente (per agente) | Public Domain |
| FastAPI / Uvicorn | Web server della dashboard | MIT / BSD |
| Python | Linguaggio di programmazione | PSF License (BSD) |
| Ubuntu Linux | Sistema operativo | GPL v2 (gratuito) |
| NVIDIA CUDA Toolkit | Driver GPU e stack di calcolo | NVIDIA EULA (gratuito, proprietario) |
| Tailscale | VPN per accesso remoto (opzionale) | BSD / gratuito fino a 3 utenti |
Unico componente non open source: driver NVIDIA CUDA (gratuiti, ma proprietari). Tutti gli altri componenti sono completamente Open Source con licenze permissive. Nessun canone di licenza, nessuna restrizione d’uso, nessun vendor lock-in.
La consultiamo gratuitamente e senza impegno su quale sia il miglior punto di partenza per la Sua azienda.
Richieda una consulenza gratuita