Altyapı
Donanım, veritabanları, taşınabilirlik — SovereignNode'unuzun fiziksel ve mantıksal temeli.
Altyapı
Tek bir sunucu. Yerel GPU. Bulut bağımlılığı yok. SovereignNode her AIMOS kurulumunun kalbidir — tüm bileşenleri barındıran fiziksel veya sanal bir sunucu.
Her şey şirket içinde çalışır: LLM çıkarımı, veritabanları, asistan süreçleri ve iletişim kanalları. Siz açıkça yapılandırmadıkça (ör. Telegram mesajları) hiçbir byte ağınızı terk etmez.
| Starter | Business | Professional | Enterprise | |
|---|---|---|---|---|
| Hardware | ||||
| GPU | RTX 4060 Ti 16 GB |
RTX 3090 / 5090 24–32 GB |
2× RTX 3090 NVLink 48 GB |
A100 / H100 80+ GB |
| YZ Modeli | 14B (Q4) | 27B (Q4) | 70B (Q4) | 70B (Q4) + 9B Draft |
| Speculative Decoding | — | İsteğe bağlı 5090'da: +4B Draft |
+4B Draft ~17K Context |
+9B Draft ~75K Context |
| Hız | ~30 Tok/s | ~35 Tok/s 5090+Spec : ~90 Tok/s |
~20 Tok/s +Spec : ~50 Tok/s |
~40 Tok/s +Spec : ~100 Tok/s |
| YZ Asistanları | 2–4 | 5–10 5090+Spec : 10–20 |
5–10 | 15–30 |
| Teknoloji | TurboQuant | TurboQuant + SGLang |
TurboQuant + NVLink + Spec. |
TurboQuant + SGLang + Spec. Decoding |
| Donanım yaklaş. | 1.200 EUR'den GPU ~400 EUR |
2.000 EUR'den 3090 : ~700 | 5090 : ~3 500 |
2.500 EUR'den 2× 3090 + NVLink |
talep üzerine A100 : A100: ~3.500'den (ikinci el) |
| Görev Uygunluğu | ||||
| ERP Sorguları | ||||
| Veri Çıkarma | ||||
| Randevu Yönetimi | ||||
| İç Destek | ||||
| Belge Arama | ||||
| Müşteri İletişimi | ||||
| Teknik Danışmanlık | ||||
| Çok Dilli | ||||
| Compliance | ||||
Basé sur IFEval, MT-Bench, BFCL et Qwen/Llama Benchmarks (2024). Ubuntu 24.04/26.04 LTS, 16+ çekirdek CPU önerilir.
Mimari Genel Bakış
Dual-DB
AIMOS, açıkça ayrılmış sorumluluklara sahip iki veritabanı sistemi kullanır:
Ortak Dinleyici, Orkestratör ve asistanlar arasında merkezi mesaj iletimi. Gelen mesajları, denetim kayıtlarını, PII-Vault eşlemelerini ve oturum verilerini saklar. Connection Pooling ile çoklu süreç desteği.
Her asistan, anlamsal, episodik ve prosedürel belleğe sahip kendi SQLite veritabanına sahiptir. FTS5 + Vektör embedding'leri ile hibrit arama. Dosyayı kopyalayarak kolayca taşınabilir.
Birlikte Çalışabilirlik
AIMOS asistanları açık standartlar aracılığıyla taşınabilir, uyumlu ve birlikte çalışabilirdir.
Open Agent Package formatı, bir asistanın bellek, beceriler ve yapılandırması dahil tam dışa aktarımını taşınabilir arşiv olarak sağlar.
Model Context Protocol, harici LLM'lerin (Claude, GPT vb.) AIMOS becerilerine erişmesini sağlar. 39 araç MCP sunucusu olarak hazırdır.
Her asistan, Google A2A spesifikasyonuna göre bir Asistan Kartı (JSON-LD) yayınlar. Harici sistemler yetenekleri, girdi formatlarını ve güven seviyesini sorgulayabilir.
Teknik Öne Çıkan Özellikler
Metin hileleri veya Regex ayrıştırma yok — AIMOS, LLM'nin yerel Tool-Calling API'sini kullanır. Asistan eylemleri yalnızca açıklamak yerine sistemleri doğrudan yönetir.
Konuşma tanıma (Whisper STT) ve konuşma sentezi (Piper TTS) tüm dillerde — asistanlar sesli mesajları anlar ve kullanıcının ana dilinde yanıt verir.
Her LLM çağrısı kaydedilir: Giriş/çıkış token'ları, gecikme, bağlam kullanımı. Asistan başına, konuşma başına, ay başına tam maliyet şeffaflığı.
Her asistan kiminle hangi kanalda konuştuğunu bilir. Telegram, e-posta ve dahili mesajlar temiz şekilde ayrılır — konuşma ortakları arasında karışıklık olmaz.