Preise
Keine Lizenzgebühren für die Software. Sie zahlen nur für Setup, Integration und optionale Wartung. AIMOS ist und bleibt Open Source.
einmalig, wird bei Beauftragung voll angerechnet
Einmalige Leistungen
Von der Hardware-Beratung bis zum produktiven Betrieb.
| Leistung | Beschreibung | Preis (netto) |
|---|---|---|
| Hardware-Beratung | GPU-Empfehlung, Server-Spezifikation, Beschaffungsunterstützung | 600 – 1.800 EUR |
| SovereignNode Installation | Betriebssystem, AIMOS, LLM-Runtime (SGLang), PostgreSQL, SSL, VPN (Tailscale), Firewall | 2.500 – 5.000 EUR |
| Erster Agent (individuell) | System-Prompt, Persönlichkeit, Skills, Konnektoren, Testing mit Echtdaten | 1.800 – 3.600 EUR |
| Jeder weitere Agent | Konfiguration, Skills, Konnektoren, Testing | 1.000 – 1.800 EUR |
| ERP / CRM-Integration | SQL-Mapping, API-Anbindung, Test mit Produktionsdaten (pro System) | 1.200 – 3.600 EUR |
| CAD / Dokumenten-Integration | AutoCAD, Tekla, PDF, Office-Formate — Lesen, Analysieren, Stücklisten | 1.200 – 3.600 EUR |
| Agent-Migration | Agenten von unserem Server auf Ihren SovereignNode migrieren (inkl. Gedächtnis) | 600 – 1.200 EUR |
Typisches Erstprojekt: SovereignNode + 2 Agenten + 1 ERP-Anbindung = 8.000 – 15.000 EUR. Das PoC-Budget (2.500 EUR) wird dabei voll angerechnet.
Monatliche Wartung
Optional, aber empfohlen. AIMOS läuft auch ohne Wartungsvertrag — es ist Ihre Software.
12 Monate Mindestlaufzeit
12 Monate Mindestlaufzeit
6 Monate Mindestlaufzeit
Flexible Leistungen
Für individuelle Anforderungen außerhalb der Pakete.
Neue Skills, Konnektoren, Agenten, System-Prompts, ERP-Anbindungen
Remote-Workshops für Ihr Team: Dashboard, Agent-Verwaltung, Best Practices
Außerhalb der Geschäftszeiten, Wochenende, Feiertage
Die eigentliche Frage
AIMOS ist kein Chat-Bot. Es ist ein autonomes System, das Routinearbeit übernimmt, die heute Ihre Mitarbeiter manuell erledigen — und das rund um die Uhr.
Sachbearbeiter sucht Salden, Rechnungen, Zahlungsstatus im ERP-System
Nur während Bürozeiten. Urlaub/Krankheit = Ausfall.
Mitarbeiter beantwortet Anfragen per E-Mail, Telefon, Messenger
Antwortzeit abhängig von Verfügbarkeit. Wissen geht bei Personalwechsel verloren.
AIMOS-Agent antwortet sofort, fragt ERP ab, kennt die Historie
Kein Urlaub, kein Krankenstand, kein Wissensverlust. Mitarbeiter werden für anspruchsvollere Aufgaben frei.
AIMOS übernimmt Routine-Aufgaben, die heute qualifizierte Mitarbeiter unter Wert beschäftigen: Salden nachschlagen, Standard-Anfragen beantworten, Dokumente zusammenfassen, Termine nachverfolgen. Ihre Mitarbeiter gewinnen Zeit für das, wofür Sie sie eingestellt haben — Kundenbeziehungen, Entscheidungen, kreative Arbeit.
Der AIMOS-Agent hat ein dauerhaftes Gedächtnis: Er kennt jeden Kunden, jede Präferenz, jeden offenen Vorgang. Wenn ein Mitarbeiter das Unternehmen verlässt, bleibt das Wissen — im Agenten.
Hardware
AIMOS läuft auf einem einzelnen Server mit NVIDIA-GPU. Keine Cloud, keine monatlichen Compute-Kosten. Die Hardware gehört Ihnen.
Einmalige Anschaffung — ab ca. 5.000 EUR
Betriebssystem: Ubuntu 26.04 LTS (empfohlen) oder 24.04 LTS. Stromverbrauch: ~170W Durchschnitt, ca. 45 EUR/Monat.
Qwen 3.5:27B auf RTX 5090 — ca. 40 Tokens/Sek. Ausgabe, ~500 Tokens/Sek. Prompt-Verarbeitung
Einzelner Assistent, gelegentliche Anfragen
Mehrere Abteilungen, regelmäßige Gespräche
Ganze Firma, viele Gespräche, Tool-Ketten
Ein Token ist die kleinste Verarbeitungseinheit des Sprachmodells — grob ein Wort oder Wortteil. Eine typische Telegram-Nachricht umfasst 30–100 Tokens, eine ausführliche Antwort des Agenten 100–300 Tokens.
Pro Agent-Interaktion verarbeitet das System ca. 4.000–6.000 Tokens (System-Prompt + Gedächtnis + Konversationsverlauf + Antwort). Bei 100 Interaktionen pro Tag sind das ca. 500.000 Tokens — die GPU ist dabei nur 10% ausgelastet.
Selbst bei intensiver Nutzung mit 10 Agenten bleibt 65% GPU-Kapazität frei. Ein SovereignNode ist für den gesamten Mittelstand mehr als ausreichend dimensioniert. Die KI wartet auf Ihre Mitarbeiter — nicht umgekehrt.
Keine laufenden Compute-Kosten: Im Gegensatz zu Cloud-KI zahlen Sie nicht pro Token. Nach der einmaligen Hardware-Anschaffung (~5.000 EUR) fallen nur Stromkosten von ca. 45 EUR/Monat an — unabhängig davon, wie viele Tokens Ihre Agenten verarbeiten.
AIMOS baut auf einem Stack vollständig quelloffener Komponenten auf. Keine proprietären Abhängigkeiten, keine versteckten Lizenzkosten.
| Komponente | Funktion | Lizenz |
|---|---|---|
| AIMOS | Multi-Agent-Plattform | MIT |
| Qwen 3.5 (Alibaba) | Sprachmodell (LLM, 27B Parameter) | Apache 2.0 |
| SGLang | LLM-Runtime mit RadixAttention (Prefix-Cache) | Apache 2.0 |
| Faster-Whisper | Spracherkennung (Speech-to-Text) | MIT |
| OpenAI Whisper (Modell) | Whisper Medium Sprachmodell | MIT |
| Piper TTS | Sprachsynthese (Text-to-Speech) | MIT |
| Sentence-Transformers | Embedding-Modell für semantische Suche | Apache 2.0 |
| PostgreSQL | Relationale Datenbank (Relay + Config) | PostgreSQL License (BSD) |
| SQLite | Agent-Gedächtnis (pro Agent) | Public Domain |
| FastAPI / Uvicorn | Dashboard-Webserver | MIT / BSD |
| Python | Programmiersprache | PSF License (BSD) |
| Ubuntu Linux | Betriebssystem | GPL v2 (kostenlos) |
| NVIDIA CUDA Toolkit | GPU-Treiber & Compute-Stack | NVIDIA EULA (kostenlos, proprietär) |
| Tailscale | VPN für Remote-Zugriff (optional) | BSD / kostenlos für ≤3 User |
Einzige nicht-quelloffene Komponente: NVIDIA CUDA-Treiber (kostenlos, aber proprietär). Alle anderen Komponenten sind vollständig Open Source mit permissiven Lizenzen. Keine Lizenzgebühren, keine Nutzungsbeschränkungen, keine Vendor-Lock-ins.
Wir beraten Sie kostenlos und unverbindlich, welcher Einstieg für Ihr Unternehmen am besten passt.
Kostenlos beraten lassen