Altyapı

Sistem & Altyapı

Donanım, veritabanları, taşınabilirlik — SovereignNode'unuzun fiziksel ve mantıksal temeli.

Altyapı

SovereignNode

Tek bir sunucu. Yerel GPU. Bulut bağımlılığı yok. SovereignNode her AIMOS kurulumunun kalbidir — tüm bileşenleri barındıran fiziksel veya sanal bir sunucu.

Her şey şirket içinde çalışır: LLM çıkarımı, veritabanları, asistan süreçleri ve iletişim kanalları. Siz açıkça yapılandırmadıkça (ör. Telegram mesajları) hiçbir byte ağınızı terk etmez.

Starter Business Professional Enterprise
Hardware
GPU RTX 4060 Ti
16 GB
RTX 3090 / 5090
24–32 GB
2× RTX 3090 NVLink
48 GB
A100 / H100
80+ GB
YZ Modeli 14B (Q4) 27B (Q4) 70B (Q4) 70B (Q4) + 9B Draft
Speculative Decoding İsteğe bağlı
5090'da: +4B Draft
+4B Draft
~17K Context
+9B Draft
~75K Context
Hız ~30 Tok/s ~35 Tok/s
5090+Spec : ~90 Tok/s
~20 Tok/s
+Spec : ~50 Tok/s
~40 Tok/s
+Spec : ~100 Tok/s
YZ Asistanları 2–4 5–10
5090+Spec : 10–20
5–10 15–30
Teknoloji TurboQuant TurboQuant
+ SGLang
TurboQuant
+ NVLink + Spec.
TurboQuant + SGLang
+ Spec. Decoding
Donanım yaklaş. 1.200 EUR'den
GPU ~400 EUR
2.000 EUR'den
3090 : ~700 | 5090 : ~3 500
2.500 EUR'den
2× 3090 + NVLink
talep üzerine
A100 : A100: ~3.500'den (ikinci el)
Görev Uygunluğu
ERP Sorguları
Veri Çıkarma
Randevu Yönetimi
İç Destek
Belge Arama
Müşteri İletişimi
Teknik Danışmanlık
Çok Dilli
Compliance
Excellent Bon Mümkün, kısıtlamalarla Önerilmez

Basé sur IFEval, MT-Bench, BFCL et Qwen/Llama Benchmarks (2024). Ubuntu 24.04/26.04 LTS, 16+ çekirdek CPU önerilir.

Mimari Genel Bakış

SovereignNode GPU (NVIDIA CUDA / LLM Runtime) Qwen 3.5:27B (Q4, ~17 GB VRAM, native Tool-Calling) PostgreSQL SQLite (Memory) Orchestrator + VRAM Guard Agent A Agent B Agent C Ortak Dinleyici (Telegram, E-posta, Ses)

Dual-DB

Çift Veritabanı Mimarisi

AIMOS, açıkça ayrılmış sorumluluklara sahip iki veritabanı sistemi kullanır:

PostgreSQL (Relay Veritabanı)

Ortak Dinleyici, Orkestratör ve asistanlar arasında merkezi mesaj iletimi. Gelen mesajları, denetim kayıtlarını, PII-Vault eşlemelerini ve oturum verilerini saklar. Connection Pooling ile çoklu süreç desteği.

SQLite (Asistan Belleği)

Her asistan, anlamsal, episodik ve prosedürel belleğe sahip kendi SQLite veritabanına sahiptir. FTS5 + Vektör embedding'leri ile hibrit arama. Dosyayı kopyalayarak kolayca taşınabilir.

PostgreSQL message_relay audit_log pii_vault sessions llm_usage SQLite (asistan başına) semantic_memory episodic_memory procedural_memory vector_embeddings dreaming_log Senkronizasyon Orkestratör üzerinden

Birlikte Çalışabilirlik

Asistan Taşınabilirliği

AIMOS asistanları açık standartlar aracılığıyla taşınabilir, uyumlu ve birlikte çalışabilirdir.

OAP Dışa/İçe Aktarma

Open Agent Package formatı, bir asistanın bellek, beceriler ve yapılandırması dahil tam dışa aktarımını taşınabilir arşiv olarak sağlar.

asistan_export.oap
  config.yaml
  memory.sqlite
  skills/
  prompts/

MCP Uyumluluğu

Model Context Protocol, harici LLM'lerin (Claude, GPT vb.) AIMOS becerilerine erişmesini sağlar. 39 araç MCP sunucusu olarak hazırdır.

sql_query file_read rest_call memory_search +35 daha

A2A Asistan Kartları

Her asistan, Google A2A spesifikasyonuna göre bir Asistan Kartı (JSON-LD) yayınlar. Harici sistemler yetenekleri, girdi formatlarını ve güven seviyesini sorgulayabilir.

"name": "Yapı Asistanı",
"skills": ["cad_read", "bom_gen"],
"trust_ring": 1
SovereignNode A Dışa aktarma: asistan.oap Transfer OAP (Bellek + Beceriler + Yapılandırma) İçe aktarma SovereignNode B Asistan aktif

Teknik Öne Çıkan Özellikler

AIMOS'u farklı kılan ne

Yerel Tool-Calling

Metin hileleri veya Regex ayrıştırma yok — AIMOS, LLM'nin yerel Tool-Calling API'sini kullanır. Asistan eylemleri yalnızca açıklamak yerine sistemleri doğrudan yönetir.

Çok Dilli Ses

Konuşma tanıma (Whisper STT) ve konuşma sentezi (Piper TTS) tüm dillerde — asistanlar sesli mesajları anlar ve kullanıcının ana dilinde yanıt verir.

Token İzleme

Her LLM çağrısı kaydedilir: Giriş/çıkış token'ları, gecikme, bağlam kullanımı. Asistan başına, konuşma başına, ay başına tam maliyet şeffaflığı.

Konuşma İş Parçacıkları

Her asistan kiminle hangi kanalda konuştuğunu bilir. Telegram, e-posta ve dahili mesajlar temiz şekilde ayrılır — konuşma ortakları arasında karışıklık olmaz.