Giriş: Stable Diffusion nedir?

Stable Diffusion, metin tabanlı komutlardan yüksek kaliteli görseller üretebilen bir açık kaynaklı görüntü oluşturma modelidir. Modelin çalışma prensibi, metinden başlayarak kademeli olarak gürültüyü gidererek temiz bir görsel üretmeye dayanır; bu yapı ve genel tanım hakkında resmi bilgiler için AWS dokümantasyonuna bakabilirsiniz (AWS).

Donanım ve yazılım: nelere dikkat edilmeli?

Stable Diffusion’u yerelde çalıştırmak istiyorsanız genellikle bir GPU önerilir; birçok kurulum rehberi ve eğitim içeriği NVIDIA tabanlı GPU’ları ve CUDA desteğini önerir, ancak güncel gereksinimler için resmi kaynakları kontrol edin (YaÖzet). Bulut tabanlı servisler de GPU gereksinimini soyutlayarak hızlı denemeler yapmanızı sağlar.

Yazılım açısından Python ve ilgili kütüphaneler, model ağırlıkları ve bir kullanıcı arayüzü (CLI veya web UI) gerekir. Ağırlıkları indirirken lisans koşullarını ve kullanım sınırlamalarını kontrol etmeyi unutmayın.

Hızlı kurulum adımları (yerel / bulut)

Aşağıda hem yerel hem de bulut kullanımı için temel adımlar özetlenmiştir. Bu adımlar, farklı topluluk rehberleri ve eğitim içeriklerinde örneklendirilmektedir (Hazır Promptlar, YaÖzet).

  • Yerel kurulum (genel):
    • Python ve paket yöneticisini kurun.
    • Gerekli kütüphaneleri ve model ağırlıklarını edin (lisansları kontrol edin).
    • Topluluk tarafından sağlanan bir arayüz veya CLI kullanarak modeli başlatın ve test edin.
  • Bulut / Hosted:
    • Bulut sağlayıcısında veya hazır hizmette hesap açın ve model veya Space seçin.
    • Model ağırlıklarını veya hazır bir Space'i kullanarak denemeye başlayın.

İlk deneme: txt2img ile hızlı örnek

İlk çalıştırmada hedef, sistemin doğru çalıştığını görmek ve basit bir prompt ile beklenen çıktıyı almaktır. Örnek adımlar:

  1. Basit bir konu seçin (ör. "şehir manzarası, gün batımı").
  2. Detay seviyesini kademeli artırın: önce kısa bir prompt, sonra stil ve aydınlatma öğeleri ekleyin.
  3. Üretimi değerlendirirken göze çarpan artefaktları not edin ve sonraki iterasyonda prompt veya ayarları değiştirin.

Etkili prompt yazma: yapı ve ipuçları

Etkili prompt, istenen görsel öğeleri açık ve önceliklendirilmiş şekilde tanımlar. Aşağıdaki pratik ipuçları genelde işe yarar ve topluluk rehberlerinde sıkça vurgulanır (Hazır Promptlar):

  • Özne ve eylem: Kim/neyin olduğu ve ne yaptığı net olsun (örn. "yağlı boya tarzında bir kedi, piyano çalarken").
  • Stil tanımları: "sinematik", "suluboya", "fotoğraf gerçekçiliği" gibi stil etiketleri ekleyin.
  • Aydınlatma ve kompozisyon: "yumuşak yan ışık", "üstten aydınlatma", "ön plan bulanık" gibi öğeler kullanın.
  • Negatif prompt: İstenmeyen öğeleri açıkça belirtin (örn. "bulanık, düşük kalite, watermark içermesin").
  • Basamaklı test: Önce kısa bir promptla başlayın, sonra ayrıntı ekleyin.

txt2img örnek promptlar (Türkçe)

  • Portre, gerçekçi: "Gerçekçi kadın portresi, yumuşak sinematik aydınlatma, doğal ten dokusu, 85mm perspektif, minimal arka plan".
  • İllüstrasyon, fantezi: "Renkli fantezi ormanı, neon bitkiler, geniş açı, çizgi roman tarzı, yüksek detay".
  • Ürün fotoğrafı: "Minimalist masa lambası ürünü, beyaz stüdyo arka planı, net gölgeler, yüksek kontrast".

Her promptu çalıştırırken istenmeyen öğeleri negatif prompt ile engelleyebilirsiniz (örn. "çizim hataları, metin, watermark yok").

İleri kullanım: Inpainting, LoRA ve ControlNet

Modeli daha kontrollü kullanmak için birkaç ek teknik vardır. Bu teknikler belirli görevlerde sonuçları önemli ölçüde iyileştirebilir (AI Rehberi):

  • Inpainting: Görselin belirli bir bölümünü yeniden üretmek için maske kullanılır; rötuş ve tamamlama için uygundur.
  • LoRA (Low-Rank Adaptation): Mevcut ağırlıkların üzerine küçük adaptörler ekleyerek belirli bir stile veya öğeye hızlıca uyum sağlar; tam model yeniden eğitimi kadar maliyetli değildir.
  • ControlNet: Kompozisyon kontrolü sağlamak için ek koşullandırma katmanları kullanır (pose, kenar haritası, normal haritası gibi kontrol girdileri ile daha tutarlı sonuçlar elde edilir).

LoRA ile pratik akış (örnek)

  • Hedef stili veya öğeyi temsil eden temiz ve etiketli bir küçük veri seti hazırlayın.
  • LoRA eğitimi için rehbere uygun hiperparametrelerle kısa bir eğitim uygulayın.
  • İnference sırasında LoRA ağırlıklarını yükleyin ve etkisini ölçekleyerek test edin.

ControlNet ile kompozisyon kontrolü (örnek)

  • İstediğiniz kompozisyonun basit bir kontrol görüntüsünü (örn. kenar haritası veya pose skeleti) hazırlayın.
  • ControlNet katmanını ilgili kontrol girdisiyle birlikte inference aşamasında etkinleştirin.
  • Çıktıyı değerlendirip kontrol ağırlığını ayarlayarak istenen düzeyi yakalayın.

Model ince ayarı (fine-tuning) için pratik kontrol listesi

Model ince ayarı planlarken aşağıdaki adımlar genelde işe yarar. Daha ileri teknik açıklamalar ve örnekler için AI Rehberi'ne bakabilirsiniz (AI Rehberi):

  • Veri seçimi ve etiketleme: Temiz, tutarlı ve yeterli çeşitlilikte örnekler toplayın.
  • Veri ön işleme: Ölçekleme, kırpma ve gerekirse augmentasyon uygulayın.
  • Hangi yaklaşımı kullanacağınıza karar verin: tam model eğitimi mi yoksa LoRA/hafif adaptasyon mu?
  • Eğitim sırasında küçük test kümeleri ile düzenli validasyon yapın; aşırı uyumdan kaçının.
  • Elde edilen modeli küçük ölçekli örneklerle test edip görsel kaliteyi değerlendirin.

Performans ve optimizasyon ipuçları

  • Bellek sınırlamalarıyla karşılaşırsanız çözünürlüğü veya batch boyutunu azaltmak etkili olabilir.
  • Hafif adaptasyon yöntemleri (ör. LoRA) genelde daha az hesap kaynağıyla iyi sonuç verir.
  • Bulut sağlayıcılarında GPU türleri ve fiyat/performans dengesi değişir; denemelerle en uygun çözümü bulun.

Sık karşılaşılan sorunlar ve çözümleri

  • Çok düşük kalite / artefaktlar: Promptu sadeleştirin veya farklı bir stil tanımı deneyin; inpainting ile müdahale edilebilir.
  • Oturma bellek hatası (OOM): Çözünürlüğü düşürün veya daha küçük batch ile çalışın.
  • Tutarsız anatomi veya perspektif: ControlNet veya referans görsellerle daha sıkı kontrol uygulayın.

Kaynaklar ve ileri okuma

Bu rehber pratik bir başlangıç ve orta seviye kullanım için yol gösterici amaçlıdır. Donanım gereksinimleri, lisans koşulları ve model sürümlerine dair en güncel bilgiler için her zaman kaynakların resmi dökümantasyonlarını kontrol edin.