Il singolo agente
Specialisti autonomi con memoria propria, strumenti propri e personalità — ogni agente è un assistente digitale specializzato.
Cinque componenti
Un assistente AIMOS è uno specialista autonomo che collega cinque componenti fondamentali:
Controlla il processo di pensiero in fasi: Osservare, Orientare, Agire — secondo il principio OODA.
Database SQLite proprio con memoria a lungo termine semantica, episodica e procedurale.
Raccolta di strumenti specifici: query SQL, chiamate REST, operazioni su file, funzioni specifiche del dominio.
Canale di comunicazione con l'utente: Telegram, e-mail, voce o dashboard.
Modello locale tramite runtime LLM locale. L'assistente costruisce il prompt completo da system prompt, contesto memoria e richiesta dell'utente.
Il punto decisivo: L'assistente IA prepara — Lei decide. La Sua competenza, la Sua esperienza e la Sua capacità di giudizio restano indispensabili. L'assistente IA La solleva dal lavoro di routine: raccogliere dati, monitorare scadenze, preparare bozze. Il lavoro specialistico resta a Lei.
Ciclo OODA
Un chatbot reagisce a ogni messaggio singolarmente. Un assistente AIMOS apre la propria casella di posta, ha una visione d'insieme, riconosce le correlazioni — e poi agisce in modo coordinato. Il principio alla base: il ciclo OODA dalla teoria decisionale.
Modalità reattiva
Modalità OODA
Thread tg:rossi
Sviluppatore Rossi
«I test unitari per SG-03 sono completati.»
Thread email:resp-req
Responsabile Requisiti
«TSR-17 è stato elevato ad ASIL D.»
Thread int:resp-test
Responsabile Test
«Il test di integrazione per SG-03 fallisce.»
QUADRO SITUAZIONALE (trasversale ai thread)
«Tutti e tre i messaggi riguardano il Safety Goal SG-03. L'elevazione ad ASIL D di TSR-17 modifica i requisiti di verifica: i test unitari di Rossi non sono più sufficienti (necessaria copertura MC/DC). Il test di integrazione che fallisce è un problema di timing separato.»
→ A Rossi
«Test completati, ma a causa dell'elevazione ad ASIL D la Statement Coverage non è più sufficiente. Necessaria MC/DC.»
→ Al Responsabile Requisiti
«Elevazione registrata. 3 requisiti SW interessati, i test unitari devono essere ampliati. Impact Analysis in allegato.»
→ Al Responsabile Test
«Problema di timing, non causato dall'elevazione ASIL. Inviare logfile. Il test di integrazione deve essere ripetuto dopo l'ampliamento dei test unitari.»
Ogni stakeholder riceve solo ciò che è rilevante per lui — ma ogni risposta è informata dal quadro generale.
L'orchestratore non è un modello IA, ma codice deterministico. Controlla il ciclo OODA richiamando l'LLM più volte con compiti diversi:
Il quadro situazionale esiste solo durante un ciclo batch. Non viene salvato — ciclo successivo, nuovo quadro. Le conoscenze a lungo termine vengono trasferite nella memoria.
L'assistente conosce il quadro generale, ma lo stakeholder A non viene a conoscenza della conversazione con lo stakeholder B — solo degli effetti rilevanti per lui.
La sequenza delle fasi è deterministica. L'LLM non può saltare o mescolare le fasi — riceve un incarico chiaro per ogni fase.
Tre modalità
AIMOS prevede tre tipologie di assistenti — dalla risposta vocale rapida all'impiegato strutturato. Tutti e tre possono agire in modo proattivo (cronjob, promemoria, richiami).
<500ms latenza
Reazione immediata all'input vocale. Trascrizione Whisper in parallelo al warmup dell'LLM. Risposte brevi e precise.
Reception, controllo vocale, interrogazioni rapide
<5s latenza
Conversazione rapida via Telegram, e-mail o dashboard. Memoria, schede cliente, delega ai colleghi. Cronjob per promemoria proattivi.
Supporto clienti, helpdesk, acquisizione ordini
Batch — Ciclo OODA
Controlla la propria casella di posta, ha una visione d'insieme di tutti i processi, riconosce correlazioni tra thread diversi, crea un quadro situazionale — e poi agisce in modo coordinato.
Gestione processi, conformità, assistenza progetti
Tutti e tre i tipi dispongono di memoria, competenze, connettori e possono agire in modo proattivo. La differenza sta nell'approccio: un thread vs. il quadro generale.
3-Tier Memory
Tre tipi di memoria, ricerca ibrida e un ciclo Dreaming per il consolidamento.
In stato di riposo l'agente analizza le proprie conversazioni con una chiamata LLM, estrae fatti, aggiorna note e liste attività, consolida la propria memoria e crea report settimanali.
Come il cervello umano durante il sonno — l'agente condensa le esperienze in conoscenza, rimuove le voci ridondanti e rafforza le connessioni importanti. Il risultato: risposte più precise con un minor consumo di token.
Come il cervello umano durante il sonno, AIMOS consolida i ricordi durante l'inattività:
Modello linguistico
Il Large Language Model (LLM) è il motore di pensiero dietro ogni agente. Comprende il linguaggio, prende decisioni e gestisce gli strumenti — e funziona completamente sul Suo hardware.
Le Sue richieste non lasciano mai la rete. Nessun provider cloud vede i Suoi dati.
Nessun costo per token per richiesta. Il modello funziona illimitatamente sulla Sua GPU.
Nessun limite API, nessun rate-limiting, nessuna dipendenza da servizi esterni.
Per attività complesse: escalation automatica e anonimizzata a un LLM cloud. → Dettagli
Collegamento
L'assistente comunica tramite connettori — interfacce standardizzate verso utenti, sistemi e altri assistenti. Nuovi connettori vengono sviluppati continuamente e possono essere aggiunti in qualsiasi momento per il Suo specifico panorama IT.
Testo, messaggi vocali, documenti. Messaggi proattivi per promemoria, allarmi e risultati. Shared Listener per tutti gli assistenti.
IMAP/SMTP per invio e ricezione. Monitoraggio POP3 per caselle in entrata. Formato HTML e allegati.
Whisper STT + Piper TTS — completamente locale. Riconoscimento e sintesi vocale in tutte le lingue, senza servizi cloud.
Accesso file su postazioni di lavoro via Tailscale VPN. Cartelle condivise per DXF, PDF, Excel — crittografato e senza porte aperte.
PostgreSQL, MSSQL, Firebird — esclusivamente query SELECT. Nessun accesso in scrittura ai dati di produzione. Read-Only by Design.
Collegamento API universale per ERP, CRM, gestione merci. GET, POST, PUT con autenticazione configurabile.
Architettura dei Thread
Ogni operazione riceve un proprio ID di thread. L'assistente vede sempre solo il cliente corrente — indipendentemente da quanti ne siano attivi in parallelo.
Ogni cliente riceve automaticamente un proprio thread. L'utente Telegram A non vede mai la conversazione del cliente e-mail B.
Un cliente scrive via Telegram: «Le ho inviato un'e-mail.» L'assistente trova il thread e-mail e ha subito il contesto.
Quando un assistente delega un'operazione a un collega, l'ID del thread viaggia con esso. Il destinatario lavora nello stesso contesto cliente.
Assegnazione automatica — ogni canale genera l'ID di thread corretto all'arrivo
Threading e-mail — In-Reply-To e References-Header per l'associazione corretta
File per thread — allegati associati all'operazione, multi-canale
Isolamento a livello di codice — applicato a livello di database, non dipendente dal modello IA
Cassetta degli attrezzi
Ogni assistente IA riceve esattamente le skill di cui ha bisogno. Skill personalizzate possono essere aggiunte in qualsiasi momento — per ogni settore, ogni sistema, ogni flusso di lavoro.
IMAP/SMTP, monitoraggio POP3. Invio, ricezione, allegati, monitoraggio automatico della casella di posta.
Testo, messaggi vocali, documenti. Notifiche proattive per allarmi e risultati.
Whisper STT + Piper TTS — completamente locale. Riconoscimento e sintesi vocale in tutte le lingue.
Leggere e inviare messaggi nei canali, creare riunioni online.
Cercare, creare, cambiare stato dei ticket, commentare. Query JQL, panoramica sprint.
Work item, pipeline, board. Creare attività, monitorare lo stato, sorvegliare CI/CD.
Leggere progetti e attività, seguire le milestone, aggiornare le scadenze.
Requisiti, casi di test, link di tracciabilità, confronto baseline. Per lo sviluppo automotive.
Pagine wiki e documenti — leggere, creare, aggiornare. Integrazione DMS.
Creare documenti Office: report in Word, dati in Excel, presentazioni in PowerPoint.
Scansione fatture, bolle di consegna, contratti. Rilevamento automatico dei campi. Elaborato localmente.
Riepiloghi giornalieri e settimanali, esportazione CSV, sintesi automatiche.
Interrogare articoli, clienti, ordini, livelli di scorta. Multi-backend: SAP, DATEV, personalizzato.
PostgreSQL, MSSQL, Firebird — sola lettura per design. Nessun accesso in scrittura ai dati di produzione.
Repository, merge request, pipeline CI/CD. Leggere commit, creare issue, commentare.
Accesso ai file sulle postazioni di lavoro tramite VPN. Crittografato e senza porte aperte.
Certificazioni, intervalli di manutenzione, durate contrattuali. Promemoria proattivi prima della scadenza.
Monitorare livelli di scorta, suggerimenti di riordino, avvisi di quantità minima.
Appuntamenti, scadenze, promemoria. Invio di inviti Outlook. Festività considerate automaticamente.
Persone, aziende, numeri di telefono, indirizzi e-mail. Aggiornamento automatico.
Cassetta degli attrezzi modulare: Ogni assistente IA riceve solo le skill di cui ha bisogno. Le integrazioni personalizzate (sistemi ERP specializzati, strumenti di settore, database interni) possono essere sviluppate e aggiunte come nuove skill in qualsiasi momento — senza modificare il nucleo.