LLM Ayarları ve Backend Yönetimi

Platformda kullanılan AI modellerini ve backend yapılandırmalarını yönettiğiniz bölüm.

LLM Ayarları Ana Ekranı

Sol menüden "LLM Ayarları" seçildiğinde aşağıdaki ekran açılır:

Backend ekle butonu ile birlikte aşağıdaki ekran açılır. LLM Ayarları

Üst Bölüm — Maliyet Özeti

Alan	Açıklama
Bu Ay Harcama	`"$0.00 / $1000.00"` — Aylık kullanım limiti ile mevcut harcama
Toplam Token	Toplam işlenen token sayısı (ör: `239,524`)
Prompt/Completion	Prompt vs Completion oranı
Geri Kalan Bütçe	Kalan aylık bütçe

Backend Kartları

Platforma eklenmiş her LLM backend'i bir kart olarak gösterilir:

1. Ollama-local

Tipi: Ollama
URL: http://host.docker.internal:11434
Öncelik: 3 (en düşük öncelik)
Aktif: Açık/onaylı
Alt bilgisi: Model listesi (embeddinggemma:lastest, gemma4:e4b, qwen3.5:cloud, qwem3.5/embedding0.68)

2. Ollama-MacStudio

Tipi: Ollama
URL: https://ollama.taztech.ir
Öncelik: 2
Aktif: Açık/onaylı
Alt bilgisi: Model listesi (embeddinggemma:lastest, gem4:e4b, qwen3.5:cloud)

3. OpenRouter

Tipi: OpenRouter (Cloud API)
URL: https://openrouter.ai/api/v1
Öncelik: 1 (en yüksek öncelik)
Aktif: Açık/onaylı
Alt bilgisi: Model listesi (google/gemma-4-32b-it-free, nvidia/llama-nemotron-embed-v1:1b-v2-free)

Her backend kartında "Düzenle" butonu ile detay ayarlarına erişilir.

Routing Kuralları

Alt kısımda "Routing Kuralları" bölümü — henüz tanımlı kural yok ise boş durum gösterir. "Kural Ekle" butonu ile yeni routing kuralları eklenir.

Backend Düzenleme Dialogu

Bir backend'in "Düzenle" butonuna tıklandığında detaylı yapılandırma dialogu açılır:

Backend Düzenle

Temel Alanlar

Alan	Açıklama	Örnek
Backend İsmi	Backend'in sistem içindeki adı	`ollama-local`
Display Name	Kullanıcı arayüzünde gösterilen isim	`Local Ollama`
Provider	Sağlayıcı tipi (dropdown)	`Ollama`
Default Model	Bu backend'de varsayılan olarak kullanılacak model	`qwen3.5:cloud`
Available Models (virgülle)	Bu backend üzerinde erişilebilir tüm modeller	`embeddinggemma:latest,gemma4:e4b,qwen3.5:cloud,qwen3-embedding:0.6b`

Model Yetenekleri

Her model için ayrı yetenek ayarları:

Model	Aktif	Embeddings	Tools
`embeddinggemma:latest`	✅	✅	❌
`gemma4:e4b`	✅	✅	✅ (Default)
...	...	...	...

"Default Yap" butonu ile o model varsayılan olarak atanır

Gelişmiş Ayarlar (Aşağı Kaydırma)

Backend Detay

Alan	Açıklama	Örnek
Base URL	Backend API endpoint'i	`http://host.docker.internal:11434`
API Key	Değiştirmek için doldurulan alan (gizli)	—
Öncelik	Routing önceliği (düşük sayı = yüksek öncelik)	`3`
Retry	Başarısız isteklerde tekrar deneme sayısı	`2`
Timeout (sn)	İstek zaman aşımı süresi	`180` sn
Aktif Toggle	Backend'in aktif/pasif durumu	Açık/onaylı

Routing Mantığı

Platform, backend'leri öncelik sırasına göre kullanır:

İlk olarak Öncelik 1'deki backend'e istek gönderilir
Eğer yanıt alınamazsa (timeout/error), Öncelik 2'ye geçilir
Son olarak Öncelik 3'e deneme yapılır

Bu sayede bir backend erişilemez durumda olsa bile platform çalışmaya devam eder.

LLM Ayarları Ana Ekranı​

Üst Bölüm — Maliyet Özeti​

Backend Kartları​

1. Ollama-local​

2. Ollama-MacStudio​

3. OpenRouter​

Routing Kuralları​

Backend Düzenleme Dialogu​

Temel Alanlar​

Model Yetenekleri​

Gelişmiş Ayarlar (Aşağı Kaydırma)​

Routing Mantığı​