Google DeepMind tarafından geliştirilen yeni yapay zeka modeli Genie 3, verilen yazılı komutlarla gerçek zamanlı, oynanabilir ve etkileşimli 3D dünyalar oluşturabiliyor. 720p çözünürlükte ve saniyede 24 kare hızında çalışan bu sistem şu an yalnızca araştırmacıların erişimine açık.
Daha önce 200 bin saatlik oyun videosu üzerinden eğitilen ilk Genie modeli, yalnızca kısa süreli basit oyun sahneleri oluşturabiliyordu. Aralık 2024’te tanıtılan Genie 2, çözünürlük bakımından sınırlı olmakla birlikte oyun motoruna benzer simülasyonlar üretmeye başlamıştı. Şimdi ise Genie 3, görsel kaliteyi artırmakla kalmayıp, komutları sahne içinde uygulayabilme kabiliyetiyle ayrışıyor. Kullanıcı, ortamın içine yerleştirilen bir karakteri ya da aracı doğrudan kontrol edebiliyor. Sistemin önemli bir farkı da görsel hafıza işleviyle nesnelerin konumlarını unutmaması.
DeepMind araştırmacıları, Genie 3’ün yalnızca sahne üretmekle kalmayıp, kullanıcı hareketlerine bağlı olarak sahneleri anlık güncelleyebildiğini belirtiyor. Bu sayede örneğin, bir kullanıcı komut vererek ortama yağmur yağdırabiliyor ya da yeni bir nesne çağırabiliyor. Geyiklerin piste dahil edildiği örnek bir simülasyon, modelin esnekliğini gözler önüne seriyor. Ayrıca çevresel detayların tutarlı biçimde korunması da uzun süreli etkileşimlerde deneyimi daha kararlı hâle getiriyor. Şimdilik sahneler yalnızca birkaç dakika sürdürülebiliyor.
Genie 3 ile oluşturulan ortamlar kullanıcı hareketlerine anlık tepki verebiliyor
Genie 3, önceki sürümlerden farklı olarak gerçek zamanlı işleyişe sahip olmasıyla daha fazla alanı kapsayacak bir yapıya evrilmiş durumda. Ortam içi hareketlilik, sadece izlenebilir olmakla kalmayıp aktif biçimde yönlendirilebilir hâle geliyor. Kullanıcı yazılı bir komutla ortamdaki ışık seviyesini değiştirebiliyor, yeni karakterler ekleyebiliyor veya mevcut yapıyı dönüştürebiliyor. Bu da özellikle oyun ön prototipleme ya da eğitim simülasyonları gibi alanlarda yeni imkanlar sunuyor. Komutların ardından yaşanan görsel değişimlerin gecikmesiz gerçekleşmesi, sistemin yapay zeka destekli altyapısının gerçek zamanlı çalıştığını gösteriyor.
Model hâlâ geliştirme aşamasında olduğu için genel kullanıma açılmış değil. Sadece sınırlı sayıdaki araştırmacı, test erişimiyle Genie 3 üzerinde çalışabiliyor. Bu erişim kapsamında elde edilen deneyimler, modelin eğitiminde de kullanılıyor. Sistem henüz uzun süreli senaryolar üretme kapasitesine ulaşabilmiş değil. Özellikle metin bazlı içeriklerde, okunabilir yazı üretimi gibi alanlarda bazı kısıtlamalar sürüyor.
Genie 3, sadece oyun üretimiyle sınırlı olmayan bir potansiyel barındırıyor. DeepMind’ın açıklamasına göre model, otonom araç testleri, robotik eğitim simülasyonları ve sanal ortam temelli görev planlaması gibi alanlarda da deneniyor. Fiziksel dünya koşullarını tam anlamıyla simüle edemese de, senaryo tabanlı eğitim süreçlerine katkı sağlayabilecek bir yapıda. Yani sadece eğlence amaçlı değil, araştırma ve geliştirme faaliyetleri için de kullanıma uygun bir zemin sunuyor.
Bunun yanında modelin AGI (Yapay Genel Zeka) geliştirme sürecinde bir adım olarak görüldüğü de belirtiliyor. DeepMind yetkilileri, modelin ortamı anlayan, değişimlere yanıt veren ve içeriğe müdahale edebilen yapısıyla bu alanda yeni bir faza geçildiğini ifade ediyor. Yine de Genie 3’ün, yüksek doğrulukta fiziksel simülasyon üretebilmesi için zamana ve daha fazla veriyle eğitime ihtiyaç duyduğu vurgulanıyor. Şu anda sistem, yalnızca birkaç dakikalık görsel sahneleri sürdürülebilir kılabiliyor.
Genie 3’ün tüm bu özelliklerine rağmen kullanıcıya doğrudan sunulması planlanan bir sürüm hakkında henüz bir açıklama yapılmadı. Sistemin daha geniş kitlelerle buluşmasının zaman alacağı öngörülüyor. Ancak geliştirici ekip, elde edilen geri bildirimlerle sistemin sahne süresini uzatmayı ve görsel detayları iyileştirmeyi hedefliyor. Bu gelişmelerin, ilerleyen dönemde daha kapsamlı uygulamaların önünü açabileceği düşünülüyor.