Preise — AIMOS

Einmalige Leistungen

Setup & Integration

Von der Hardware-Beratung bis zum produktiven Betrieb.

Leistung	Beschreibung	Preis (netto)
Hardware-Beratung	GPU-Empfehlung, Server-Spezifikation, Beschaffungsunterstützung	600 – 1.800 EUR
SovereignNode Installation	Betriebssystem, AIMOS, LLM-Runtime (SGLang), PostgreSQL, SSL, VPN (Tailscale), Firewall	2.500 – 5.000 EUR
Erster Agent (individuell)	System-Prompt, Persönlichkeit, Skills, Konnektoren, Testing mit Echtdaten	1.800 – 3.600 EUR
Jeder weitere Agent	Konfiguration, Skills, Konnektoren, Testing	1.000 – 1.800 EUR
ERP / CRM-Integration	SQL-Mapping, API-Anbindung, Test mit Produktionsdaten (pro System)	1.200 – 3.600 EUR
CAD / Dokumenten-Integration	AutoCAD, Tekla, PDF, Office-Formate — Lesen, Analysieren, Stücklisten	1.200 – 3.600 EUR
Agent-Migration	Agenten von unserem Server auf Ihren SovereignNode migrieren (inkl. Gedächtnis)	600 – 1.200 EUR

Typisches Erstprojekt: SovereignNode + 2 Agenten + 1 ERP-Anbindung = 8.000 – 15.000 EUR. Das PoC-Budget (2.500 EUR) wird dabei voll angerechnet.

Monatliche Wartung

Support & Weiterentwicklung

Optional, aber empfohlen. AIMOS läuft auch ohne Wartungsvertrag — es ist Ihre Software.

Basis

350 EUR/Monat

12 Monate Mindestlaufzeit

Software-Updates & Sicherheitspatches
System-Monitoring (Dashboard-Zugang)
E-Mail-Support (48h Reaktionszeit)
Monatlicher Token-Verbrauchsreport

Anfragen

Standard

Premium

1.200 EUR/Monat

6 Monate Mindestlaufzeit

Alles aus Standard
4h Reaktionszeit (Geschäftszeiten)
Monatlicher Review-Call (60 Min)
Bis zu 5h Entwicklungsarbeit pro Monat inklusive
Neue Agenten & Skills inklusive

Anfragen

Flexible Leistungen

Stundensätze

Für individuelle Anforderungen außerhalb der Pakete.

150 EUR

pro Stunde (netto)

Entwicklung

Neue Skills, Konnektoren, Agenten, System-Prompts, ERP-Anbindungen

180 EUR

pro Stunde (netto)

Schulung

Remote-Workshops für Ihr Team: Dashboard, Agent-Verwaltung, Best Practices

220 EUR

pro Stunde (netto)

Notfall-Support

Außerhalb der Geschäftszeiten, Wochenende, Feiertage

Die eigentliche Frage

Was kostet es, nichts zu ändern?

AIMOS ist kein Chat-Bot. Es ist ein autonomes System, das Routinearbeit übernimmt, die heute Ihre Mitarbeiter manuell erledigen — und das rund um die Uhr.

Heute: Manuell

Buchhaltungs-Abfragen

Sachbearbeiter sucht Salden, Rechnungen, Zahlungsstatus im ERP-System

Zeitaufwand ~15 Min/Abfrage

Abfragen/Tag ~20

Arbeitszeit/Tag ~5 Stunden

Personalkosten/Monat ~2.500 EUR

Nur während Bürozeiten. Urlaub/Krankheit = Ausfall.

Heute: Manuell

Kunden-Anfragen beantworten

Mitarbeiter beantwortet Anfragen per E-Mail, Telefon, Messenger

Zeitaufwand ~10 Min/Anfrage

Anfragen/Tag ~15

Arbeitszeit/Tag ~2,5 Stunden

Personalkosten/Monat ~1.200 EUR

Antwortzeit abhängig von Verfügbarkeit. Wissen geht bei Personalwechsel verloren.

Mit AIMOS

Beides automatisiert

AIMOS-Agent antwortet sofort, fragt ERP ab, kennt die Historie

Antwortzeit 3–10 Sekunden

Verfügbarkeit 24/7/365

Wissenserhalt Permanent

AIMOS Wartung/Monat 350–650 EUR

Kein Urlaub, kein Krankenstand, kein Wissensverlust. Mitarbeiter werden für anspruchsvollere Aufgaben frei.

Der Punkt ist nicht, Mitarbeiter zu ersetzen.

AIMOS übernimmt Routine-Aufgaben, die heute qualifizierte Mitarbeiter unter Wert beschäftigen: Salden nachschlagen, Standard-Anfragen beantworten, Dokumente zusammenfassen, Termine nachverfolgen. Ihre Mitarbeiter gewinnen Zeit für das, wofür Sie sie eingestellt haben — Kundenbeziehungen, Entscheidungen, kreative Arbeit.

Der AIMOS-Agent hat ein dauerhaftes Gedächtnis: Er kennt jeden Kunden, jede Präferenz, jeden offenen Vorgang. Wenn ein Mitarbeiter das Unternehmen verlässt, bleibt das Wissen — im Agenten.

Hardware

Der SovereignNode

AIMOS läuft auf einem einzelnen Server mit NVIDIA-GPU. Keine Cloud, keine monatlichen Compute-Kosten. Die Hardware gehört Ihnen.

Empfohlene Konfiguration

Einmalige Anschaffung — ab ca. 5.000 EUR

~5.000 EUR

GPU

NVIDIA RTX 5090

32 GB GDDR7 — ca. 2.500 EUR

CPU

16+ Kerne

AMD Ryzen 9 / Intel i7

RAM

64 GB DDR5

Für Embedding-Modell + DB

Speicher

1 TB NVMe SSD

Modelle + Datenbanken + Logs

Betriebssystem: Ubuntu 26.04 LTS (empfohlen) oder 24.04 LTS. Stromverbrauch: ~170W Durchschnitt, ca. 45 EUR/Monat.

Was leistet ein SovereignNode?

Qwen 3.5:27B auf RTX 5090 — ca. 40 Tokens/Sek. Ausgabe, ~500 Tokens/Sek. Prompt-Verarbeitung

Leichte Nutzung

1–2 Agenten

Einzelner Assistent, gelegentliche Anfragen

LLM-Aufrufe/Tag ~30

Tokens/Tag ~130.000

Tokens/Monat ~4 Mio.

GPU-Auslastung <5%

Typische Nutzung

3–5 Agenten

Mehrere Abteilungen, regelmäßige Gespräche

LLM-Aufrufe/Tag ~100

Tokens/Tag ~500.000

Tokens/Monat ~15 Mio.

GPU-Auslastung ~10%

Intensive Nutzung

5–10 Agenten

Ganze Firma, viele Gespräche, Tool-Ketten

LLM-Aufrufe/Tag ~300

Tokens/Tag ~1,9 Mio.

Tokens/Monat ~57 Mio.

GPU-Auslastung ~35%

Was bedeuten diese Zahlen?

Ein Token ist die kleinste Verarbeitungseinheit des Sprachmodells — grob ein Wort oder Wortteil. Eine typische Telegram-Nachricht umfasst 30–100 Tokens, eine ausführliche Antwort des Agenten 100–300 Tokens.

Pro Agent-Interaktion verarbeitet das System ca. 4.000–6.000 Tokens (System-Prompt + Gedächtnis + Konversationsverlauf + Antwort). Bei 100 Interaktionen pro Tag sind das ca. 500.000 Tokens — die GPU ist dabei nur 10% ausgelastet.

Selbst bei intensiver Nutzung mit 10 Agenten bleibt 65% GPU-Kapazität frei. Ein SovereignNode ist für den gesamten Mittelstand mehr als ausreichend dimensioniert. Die KI wartet auf Ihre Mitarbeiter — nicht umgekehrt.

Keine laufenden Compute-Kosten: Im Gegensatz zu Cloud-KI zahlen Sie nicht pro Token. Nach der einmaligen Hardware-Anschaffung (~5.000 EUR) fallen nur Stromkosten von ca. 45 EUR/Monat an — unabhängig davon, wie viele Tokens Ihre Agenten verarbeiten.

Wichtige Hinweise

• Alle Preise netto zzgl. gesetzl. MwSt.
• Gültig für Kunden innerhalb der Europäischen Union. Alle Leistungen werden remote erbracht (SSH, Telegram, Videocall).
• Vor-Ort-Termine (Installation, Schulung, Workshop) sind möglich und werden je nach Aufwand individuell berechnet (Reisekosten + Tagessatz).
• Hardware ist nicht im Preis enthalten. Ein SovereignNode (Server mit NVIDIA GPU) wird vom Kunden beschafft. Wir beraten bei der Auswahl.
• AIMOS ist MIT-lizenziert. Sie können die Software auch ohne Dienstleistungsvertrag eigenständig einsetzen, anpassen und weitergeben.
• Preise gültig ab April 2026. Änderungen vorbehalten.

Open-Source-Lizenzen der Komponenten

AIMOS baut auf einem Stack vollständig quelloffener Komponenten auf. Keine proprietären Abhängigkeiten, keine versteckten Lizenzkosten.

Komponente	Funktion	Lizenz
AIMOS	Multi-Agent-Plattform	MIT
Qwen 3.5 (Alibaba)	Sprachmodell (LLM, 27B Parameter)	Apache 2.0
SGLang	LLM-Runtime mit RadixAttention (Prefix-Cache)	Apache 2.0
Faster-Whisper	Spracherkennung (Speech-to-Text)	MIT
OpenAI Whisper (Modell)	Whisper Medium Sprachmodell	MIT
Piper TTS	Sprachsynthese (Text-to-Speech)	MIT
Sentence-Transformers	Embedding-Modell für semantische Suche	Apache 2.0
PostgreSQL	Relationale Datenbank (Relay + Config)	PostgreSQL License (BSD)
SQLite	Agent-Gedächtnis (pro Agent)	Public Domain
FastAPI / Uvicorn	Dashboard-Webserver	MIT / BSD
Python	Programmiersprache	PSF License (BSD)
Ubuntu Linux	Betriebssystem	GPL v2 (kostenlos)
NVIDIA CUDA Toolkit	GPU-Treiber & Compute-Stack	NVIDIA EULA (kostenlos, proprietär)
Tailscale	VPN für Remote-Zugriff (optional)	BSD / kostenlos für ≤3 User

Einzige nicht-quelloffene Komponente: NVIDIA CUDA-Treiber (kostenlos, aber proprietär). Alle anderen Komponenten sind vollständig Open Source mit permissiven Lizenzen. Keine Lizenzgebühren, keine Nutzungsbeschränkungen, keine Vendor-Lock-ins.

Transparent. Fair.
Keine versteckten Kosten.

Proof of Concept

Setup & Integration

Support & Weiterentwicklung

Basis

Standard

Premium

Stundensätze

Entwicklung

Schulung

Notfall-Support

Was kostet es, nichts zu ändern?

Buchhaltungs-Abfragen

Kunden-Anfragen beantworten

Beides automatisiert

Der Punkt ist nicht, Mitarbeiter zu ersetzen.

Der SovereignNode

Empfohlene Konfiguration

Was leistet ein SovereignNode?

1–2 Agenten

3–5 Agenten

5–10 Agenten

Was bedeuten diese Zahlen?

Wichtige Hinweise

Open-Source-Lizenzen der Komponenten

Bereit für Ihr Pilotprojekt?

Transparent. Fair. Keine versteckten Kosten.

Proof of Concept

Setup & Integration

Support & Weiterentwicklung

Basis

Standard

Premium

Stundensätze

Entwicklung

Schulung

Notfall-Support

Was kostet es, nichts zu ändern?

Buchhaltungs-Abfragen

Kunden-Anfragen beantworten

Beides automatisiert

Der Punkt ist nicht, Mitarbeiter zu ersetzen.

Der SovereignNode

Empfohlene Konfiguration

Was leistet ein SovereignNode?

1–2 Agenten

3–5 Agenten

5–10 Agenten

Was bedeuten diese Zahlen?

Wichtige Hinweise

Open-Source-Lizenzen der Komponenten

Bereit für Ihr Pilotprojekt?

Transparent. Fair.
Keine versteckten Kosten.