Google’dan alışılmışın dışında yapay zekâ: Metni tek tek değil toplu yazıyor
Google, Gemma 4 ailesine DiffusionGemma adlı yeni modeli ekledi. Metinleri sırayla üretmek yerine toplu oluşturan model, yerel sistemlerde daha yüksek hız ve verimlilik sunmayı hedefliyor.
Google DeepMind, Gemma 4 açık model ailesine yeni bir üye ekledi. DiffusionGemma adı verilen model, diğer yapay zekâ modellerinden farklı bir çalışma yöntemi kullanıyor. Model, metni kelime kelime üretmek yerine büyük bölümler halinde oluşturabiliyor. Google, bu sayede özellikle yerel sistemlerde daha yüksek hız elde ettiğini söylüyor.
Günümüzde çoğu yapay zekâ modeli metni soldan sağa doğru ve adım adım üretir. Her yeni kelime, bir öncekinin üzerine eklenir.
DiffusionGemma ise görüntü üretim modellerine daha yakın bir yapıya sahip. Model önce geçici işaretlerle dolu bir metin alanı oluşturuyor. Ardından bu alan üzerinde birçok kez işlem yaparak tahminlerini sürekli düzeltiyor. Sürecin sonunda ortaya tek parça halinde tamamlanmış bir metin çıkıyor.
Bu yöntem, görüntü üretiminde kullanılan "gürültü giderme" yaklaşımına benziyor. Ancak bu kez sonuç bir görsel değil, metin oluyor.
DiffusionGemma, Google'ın açık kaynaklı modelleri arasında büyük modellerden biri olarak öne çıkıyor.
Model toplam 26 milyar parametreye sahip olsa da çalışma sırasında bunların yalnızca 3,8 milyarı aktif hale geliyor. Bu yapı sayesinde model, üst düzey ekran kartlarının sunduğu yaklaşık 18 GB bellekte çalışabiliyor.
Şirket, bunun benzer boyuttaki standart Gemma modellerine göre yaklaşık dört kat daha yüksek üretim hızı anlamına geldiğini belirtiyor.
DiffusionGemma aynı anda 256 tokene kadar işlem yapabiliyor. Bu durum özellikle doğrusal olmayan görevlerde avantaj sağlayabiliyor.
Google'a göre model; metin düzenleme, moleküler dizilim analizi ve matematiksel grafik oluşturma gibi alanlarda daha verimli çalışabiliyor.
Bu yaklaşım daha hızlı görünse de bazı dezavantajları bulunuyor.
Google, metin üretiminde kullanılan difüzyon yönteminin hata oranının daha yüksek olabileceğini söylüyor. Görsel üretiminde tek bir piksel hatası genellikle büyük sorun yaratmaz. Ancak metinde yapılan küçük bir hata bile anlamın tamamen bozulmasına neden olabilir.
Ayrıca çıktı birkaç kelimeden oluşacaksa bu yöntem verimli çalışmıyor. Çünkü model kısa bir sonuç üretmek için bile geniş çaplı hesaplamalar yapmak zorunda kalıyor. Standart modeller ise bu tür kısa yanıtları daha az işlemle oluşturabiliyor.
Google'a göre difüzyon yaklaşımının en büyük avantajı yerel yapay zekâ uygulamalarında ortaya çıkıyor.
Bulut tabanlı sistemlerde çok sayıda kullanıcı aynı anda işlem yaptığı için donanım kaynakları zaten yoğun şekilde kullanılıyor. Bu nedenle mevcut yöntemler yüksek verim sağlayabiliyor.
Yerel bilgisayarlarda ise işlem gücü ve bellek kullanımı her zaman dengeli çalışmıyor. DiffusionGemma, kull
📌 Kaynak
Bu özet chip online kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →