Ana içeriğe geç

LLM Ayarları ve Backend Yönetimi

Platformda kullanılan AI modellerini ve backend yapılandırmalarını yönettiğiniz bölüm.

LLM Ayarları Ana Ekranı

Sol menüden "LLM Ayarları" seçildiğinde aşağıdaki ekran açılır: LLM Ayarları

Backend ekle butonu ile birlikte aşağıdaki ekran açılır. LLM Ayarları

Üst Bölüm — Maliyet Özeti

AlanAçıklama
Bu Ay Harcama"$0.00 / $1000.00" — Aylık kullanım limiti ile mevcut harcama
Toplam TokenToplam işlenen token sayısı (ör: 239,524)
Prompt/CompletionPrompt vs Completion oranı
Geri Kalan BütçeKalan aylık bütçe

Backend Kartları

Platforma eklenmiş her LLM backend'i bir kart olarak gösterilir:

1. Ollama-local

  • Tipi: Ollama
  • URL: http://host.docker.internal:11434
  • Öncelik: 3 (en düşük öncelik)
  • Aktif: Açık/onaylı
  • Alt bilgisi: Model listesi (embeddinggemma:lastest, gemma4:e4b, qwen3.5:cloud, qwem3.5/embedding0.68)

2. Ollama-MacStudio

  • Tipi: Ollama
  • URL: https://ollama.taztech.ir
  • Öncelik: 2
  • Aktif: Açık/onaylı
  • Alt bilgisi: Model listesi (embeddinggemma:lastest, gem4:e4b, qwen3.5:cloud)

3. OpenRouter

  • Tipi: OpenRouter (Cloud API)
  • URL: https://openrouter.ai/api/v1
  • Öncelik: 1 (en yüksek öncelik)
  • Aktif: Açık/onaylı
  • Alt bilgisi: Model listesi (google/gemma-4-32b-it-free, nvidia/llama-nemotron-embed-v1:1b-v2-free)

Her backend kartında "Düzenle" butonu ile detay ayarlarına erişilir.

Routing Kuralları

Alt kısımda "Routing Kuralları" bölümü — henüz tanımlı kural yok ise boş durum gösterir. "Kural Ekle" butonu ile yeni routing kuralları eklenir.


Backend Düzenleme Dialogu

Bir backend'in "Düzenle" butonuna tıklandığında detaylı yapılandırma dialogu açılır:

Backend Düzenle

Temel Alanlar

AlanAçıklamaÖrnek
Backend İsmiBackend'in sistem içindeki adıollama-local
Display NameKullanıcı arayüzünde gösterilen isimLocal Ollama
ProviderSağlayıcı tipi (dropdown)Ollama
Default ModelBu backend'de varsayılan olarak kullanılacak modelqwen3.5:cloud
Available Models (virgülle)Bu backend üzerinde erişilebilir tüm modellerembeddinggemma:latest,gemma4:e4b,qwen3.5:cloud,qwen3-embedding:0.6b

Model Yetenekleri

Her model için ayrı yetenek ayarları:

ModelAktifEmbeddingsTools
embeddinggemma:latest
gemma4:e4b✅ (Default)
............
  • "Default Yap" butonu ile o model varsayılan olarak atanır

Gelişmiş Ayarlar (Aşağı Kaydırma)

Backend Detay

AlanAçıklamaÖrnek
Base URLBackend API endpoint'ihttp://host.docker.internal:11434
API KeyDeğiştirmek için doldurulan alan (gizli)
ÖncelikRouting önceliği (düşük sayı = yüksek öncelik)3
RetryBaşarısız isteklerde tekrar deneme sayısı2
Timeout (sn)İstek zaman aşımı süresi180 sn
Aktif ToggleBackend'in aktif/pasif durumuAçık/onaylı

Routing Mantığı

Platform, backend'leri öncelik sırasına göre kullanır:

  1. İlk olarak Öncelik 1'deki backend'e istek gönderilir
  2. Eğer yanıt alınamazsa (timeout/error), Öncelik 2'ye geçilir
  3. Son olarak Öncelik 3'e deneme yapılır

Bu sayede bir backend erişilemez durumda olsa bile platform çalışmaya devam eder.