Preise

Transparent. Fair.
Keine versteckten Kosten.

Keine Lizenzgebühren für die Software. Sie zahlen nur für Setup, Integration und optionale Wartung. AIMOS ist und bleibt Open Source.

Einstieg

Proof of Concept

2.500 EUR

einmalig, wird bei Beauftragung voll angerechnet

AIMOS auf Ihrer Hardware oder temporär auf unserer installiert
1 Agent individuell konfiguriert für Ihren wichtigsten Use Case
2 Wochen Testbetrieb mit Ihren echten Daten
Abschlussbericht mit Empfehlung für den Rollout
Kein Risiko: Wenn Sie nicht überzeugt sind, entstehen keine weiteren Kosten
PoC anfragen

Einmalige Leistungen

Setup & Integration

Von der Hardware-Beratung bis zum produktiven Betrieb.

Leistung Beschreibung Preis (netto)
Hardware-Beratung GPU-Empfehlung, Server-Spezifikation, Beschaffungsunterstützung 600 – 1.800 EUR
SovereignNode Installation Betriebssystem, AIMOS, LLM-Runtime (SGLang), PostgreSQL, SSL, VPN (Tailscale), Firewall 2.500 – 5.000 EUR
Erster Agent (individuell) System-Prompt, Persönlichkeit, Skills, Konnektoren, Testing mit Echtdaten 1.800 – 3.600 EUR
Jeder weitere Agent Konfiguration, Skills, Konnektoren, Testing 1.000 – 1.800 EUR
ERP / CRM-Integration SQL-Mapping, API-Anbindung, Test mit Produktionsdaten (pro System) 1.200 – 3.600 EUR
CAD / Dokumenten-Integration AutoCAD, Tekla, PDF, Office-Formate — Lesen, Analysieren, Stücklisten 1.200 – 3.600 EUR
Agent-Migration Agenten von unserem Server auf Ihren SovereignNode migrieren (inkl. Gedächtnis) 600 – 1.200 EUR

Typisches Erstprojekt: SovereignNode + 2 Agenten + 1 ERP-Anbindung = 8.000 – 15.000 EUR. Das PoC-Budget (2.500 EUR) wird dabei voll angerechnet.

Monatliche Wartung

Support & Weiterentwicklung

Optional, aber empfohlen. AIMOS läuft auch ohne Wartungsvertrag — es ist Ihre Software.

Basis

350 EUR/Monat

12 Monate Mindestlaufzeit

  • Software-Updates & Sicherheitspatches
  • System-Monitoring (Dashboard-Zugang)
  • E-Mail-Support (48h Reaktionszeit)
  • Monatlicher Token-Verbrauchsreport
Anfragen

Standard

empfohlen
650 EUR/Monat

12 Monate Mindestlaufzeit

  • Alles aus Basis
  • Agent-Anpassungen (Prompts, Skills, Konnektoren)
  • Telegram-Support (24h Reaktionszeit)
  • Neue LLM-Modelle evaluieren & einspielen
  • Bis zu 2h Entwicklungsarbeit pro Monat inklusive
Anfragen

Premium

1.200 EUR/Monat

6 Monate Mindestlaufzeit

  • Alles aus Standard
  • 4h Reaktionszeit (Geschäftszeiten)
  • Monatlicher Review-Call (60 Min)
  • Bis zu 5h Entwicklungsarbeit pro Monat inklusive
  • Neue Agenten & Skills inklusive
Anfragen

Flexible Leistungen

Stundensätze

Für individuelle Anforderungen außerhalb der Pakete.

150 EUR
pro Stunde (netto)

Entwicklung

Neue Skills, Konnektoren, Agenten, System-Prompts, ERP-Anbindungen

180 EUR
pro Stunde (netto)

Schulung

Remote-Workshops für Ihr Team: Dashboard, Agent-Verwaltung, Best Practices

220 EUR
pro Stunde (netto)

Notfall-Support

Außerhalb der Geschäftszeiten, Wochenende, Feiertage

Die eigentliche Frage

Was kostet es, nichts zu ändern?

AIMOS ist kein Chat-Bot. Es ist ein autonomes System, das Routinearbeit übernimmt, die heute Ihre Mitarbeiter manuell erledigen — und das rund um die Uhr.

Heute: Manuell

Buchhaltungs-Abfragen

Sachbearbeiter sucht Salden, Rechnungen, Zahlungsstatus im ERP-System

Zeitaufwand ~15 Min/Abfrage
Abfragen/Tag ~20
Arbeitszeit/Tag ~5 Stunden
Personalkosten/Monat ~2.500 EUR

Nur während Bürozeiten. Urlaub/Krankheit = Ausfall.

Heute: Manuell

Kunden-Anfragen beantworten

Mitarbeiter beantwortet Anfragen per E-Mail, Telefon, Messenger

Zeitaufwand ~10 Min/Anfrage
Anfragen/Tag ~15
Arbeitszeit/Tag ~2,5 Stunden
Personalkosten/Monat ~1.200 EUR

Antwortzeit abhängig von Verfügbarkeit. Wissen geht bei Personalwechsel verloren.

Mit AIMOS

Beides automatisiert

AIMOS-Agent antwortet sofort, fragt ERP ab, kennt die Historie

Antwortzeit 3–10 Sekunden
Verfügbarkeit 24/7/365
Wissenserhalt Permanent
AIMOS Wartung/Monat 350–650 EUR

Kein Urlaub, kein Krankenstand, kein Wissensverlust. Mitarbeiter werden für anspruchsvollere Aufgaben frei.

Der Punkt ist nicht, Mitarbeiter zu ersetzen.

AIMOS übernimmt Routine-Aufgaben, die heute qualifizierte Mitarbeiter unter Wert beschäftigen: Salden nachschlagen, Standard-Anfragen beantworten, Dokumente zusammenfassen, Termine nachverfolgen. Ihre Mitarbeiter gewinnen Zeit für das, wofür Sie sie eingestellt haben — Kundenbeziehungen, Entscheidungen, kreative Arbeit.

Der AIMOS-Agent hat ein dauerhaftes Gedächtnis: Er kennt jeden Kunden, jede Präferenz, jeden offenen Vorgang. Wenn ein Mitarbeiter das Unternehmen verlässt, bleibt das Wissen — im Agenten.

Hardware

Der SovereignNode

AIMOS läuft auf einem einzelnen Server mit NVIDIA-GPU. Keine Cloud, keine monatlichen Compute-Kosten. Die Hardware gehört Ihnen.

Empfohlene Konfiguration

Einmalige Anschaffung — ab ca. 5.000 EUR

~5.000 EUR
GPU
NVIDIA RTX 5090
32 GB GDDR7 — ca. 2.500 EUR
CPU
16+ Kerne
AMD Ryzen 9 / Intel i7
RAM
64 GB DDR5
Für Embedding-Modell + DB
Speicher
1 TB NVMe SSD
Modelle + Datenbanken + Logs

Betriebssystem: Ubuntu 26.04 LTS (empfohlen) oder 24.04 LTS. Stromverbrauch: ~170W Durchschnitt, ca. 45 EUR/Monat.

Was leistet ein SovereignNode?

Qwen 3.5:27B auf RTX 5090 — ca. 40 Tokens/Sek. Ausgabe, ~500 Tokens/Sek. Prompt-Verarbeitung

Leichte Nutzung

1–2 Agenten

Einzelner Assistent, gelegentliche Anfragen

LLM-Aufrufe/Tag ~30
Tokens/Tag ~130.000
Tokens/Monat ~4 Mio.
GPU-Auslastung <5%
Typische Nutzung

3–5 Agenten

Mehrere Abteilungen, regelmäßige Gespräche

LLM-Aufrufe/Tag ~100
Tokens/Tag ~500.000
Tokens/Monat ~15 Mio.
GPU-Auslastung ~10%
Intensive Nutzung

5–10 Agenten

Ganze Firma, viele Gespräche, Tool-Ketten

LLM-Aufrufe/Tag ~300
Tokens/Tag ~1,9 Mio.
Tokens/Monat ~57 Mio.
GPU-Auslastung ~35%

Was bedeuten diese Zahlen?

Ein Token ist die kleinste Verarbeitungseinheit des Sprachmodells — grob ein Wort oder Wortteil. Eine typische Telegram-Nachricht umfasst 30–100 Tokens, eine ausführliche Antwort des Agenten 100–300 Tokens.

Pro Agent-Interaktion verarbeitet das System ca. 4.000–6.000 Tokens (System-Prompt + Gedächtnis + Konversationsverlauf + Antwort). Bei 100 Interaktionen pro Tag sind das ca. 500.000 Tokens — die GPU ist dabei nur 10% ausgelastet.

Selbst bei intensiver Nutzung mit 10 Agenten bleibt 65% GPU-Kapazität frei. Ein SovereignNode ist für den gesamten Mittelstand mehr als ausreichend dimensioniert. Die KI wartet auf Ihre Mitarbeiter — nicht umgekehrt.

Keine laufenden Compute-Kosten: Im Gegensatz zu Cloud-KI zahlen Sie nicht pro Token. Nach der einmaligen Hardware-Anschaffung (~5.000 EUR) fallen nur Stromkosten von ca. 45 EUR/Monat an — unabhängig davon, wie viele Tokens Ihre Agenten verarbeiten.

Wichtige Hinweise

  • Alle Preise netto zzgl. gesetzl. MwSt.
  • Gültig für Kunden innerhalb der Europäischen Union. Alle Leistungen werden remote erbracht (SSH, Telegram, Videocall).
  • Vor-Ort-Termine (Installation, Schulung, Workshop) sind möglich und werden je nach Aufwand individuell berechnet (Reisekosten + Tagessatz).
  • Hardware ist nicht im Preis enthalten. Ein SovereignNode (Server mit NVIDIA GPU) wird vom Kunden beschafft. Wir beraten bei der Auswahl.
  • AIMOS ist MIT-lizenziert. Sie können die Software auch ohne Dienstleistungsvertrag eigenständig einsetzen, anpassen und weitergeben.
  • Preise gültig ab April 2026. Änderungen vorbehalten.

Open-Source-Lizenzen der Komponenten

AIMOS baut auf einem Stack vollständig quelloffener Komponenten auf. Keine proprietären Abhängigkeiten, keine versteckten Lizenzkosten.

Komponente Funktion Lizenz
AIMOS Multi-Agent-Plattform MIT
Qwen 3.5 (Alibaba) Sprachmodell (LLM, 27B Parameter) Apache 2.0
SGLang LLM-Runtime mit RadixAttention (Prefix-Cache) Apache 2.0
Faster-Whisper Spracherkennung (Speech-to-Text) MIT
OpenAI Whisper (Modell) Whisper Medium Sprachmodell MIT
Piper TTS Sprachsynthese (Text-to-Speech) MIT
Sentence-Transformers Embedding-Modell für semantische Suche Apache 2.0
PostgreSQL Relationale Datenbank (Relay + Config) PostgreSQL License (BSD)
SQLite Agent-Gedächtnis (pro Agent) Public Domain
FastAPI / Uvicorn Dashboard-Webserver MIT / BSD
Python Programmiersprache PSF License (BSD)
Ubuntu Linux Betriebssystem GPL v2 (kostenlos)
NVIDIA CUDA Toolkit GPU-Treiber & Compute-Stack NVIDIA EULA (kostenlos, proprietär)
Tailscale VPN für Remote-Zugriff (optional) BSD / kostenlos für ≤3 User

Einzige nicht-quelloffene Komponente: NVIDIA CUDA-Treiber (kostenlos, aber proprietär). Alle anderen Komponenten sind vollständig Open Source mit permissiven Lizenzen. Keine Lizenzgebühren, keine Nutzungsbeschränkungen, keine Vendor-Lock-ins.

Bereit für Ihr Pilotprojekt?

Wir beraten Sie kostenlos und unverbindlich, welcher Einstieg für Ihr Unternehmen am besten passt.

Kostenlos beraten lassen