29 Şubat 2024

OpenAI Sora nedir? ChatGPT geliştiricisinden akılları alan yapay zeka!

Okan Güleş
Okan Güleş Bilim ve Teknoloji editörü
Sadece ChatGPT ile aylık 100 milyondan fazla aktif kullanıcısı bulunan OpenAI, yakın zamanda bir ilke daha imza attı ve inanılmaz bir model daha piyasaya sürdü: Sahne bu kez 'Sora'nın...

ChatGPT ile teknoloji dünyasına damga vuran OpenAI, hem yapay zekayı insanlarla buluşturdu hem de sektörel anlamda yeni bir sayfa açtı.

NEDİR BU SORA?

ChatGPT’nin GPT-4 modelleriyle daha zeki yapay zeka modeli geliştiren OpenAI, bir sonraki planında ise sürpriz yaparak yeni yapay zeka modelini tanıttı. Peki Sora nedir, yapay zeka Sora ile neler yapılabiliyor?

Zaten OpenAI’ın sohbet robotlarının hukuk fakültesine gitmeden baro sınavını geçebildiğini biliyoruz. Şimdi ise Sora adlı yeni bir yapay zeka aracı, okula gitmeden ve hiçbir eğitim almadan sinemada usta olduğunu gösteriyor. Gelin, Sora nedir yetenekleriyle neler yapabiliyor biraz daha yakından göz atalım.

Öncelikle OpenAI’ın geliştirdiği Sora, tıpkı birkaç rakibi gibi metinden görüntü oluşturabiliyor. Temel odak noktası görüntü oluşturma olan Sora, bunu OpenAI’ın da azmiyle çok daha ileriye taşıyor.

Google gibi devlerden Runway gibi startup’lara kadar pek çok şirket metinden videoya yapay zeka araçlarını bir süre önce duyurdu. Ancak OpenAI, tıpkı ChatGPT’deki gibi kendisini göstererek bu alanda sektöre öncülük ettiğini bir kez daha kanıtladı.

Sora, çarpıcı fotogerçekçiliğiyle ve diğer modellerin tipik olarak yaptığı kısa parçalardan daha uzun, bir dakikaya kadar klipler üretebilmesiyle öne çıkıyor. Şimdilik bir videonun ne kadar sürede oluşturulduğu hiçbir yerde yazmıyor ancak anlaşıldığı üzere 1 dakikalık video için birkaç dakikadan fazla beklemek gerekecek.

Sahneler kesinlikle etkileyici olsa da, Sora’nın yetenekleri arasında en şaşırtanı eğitimini almadığı yetenekler diyebiliriz.

OpenAI’nin Dall-E 3 görüntü oluşturucusu tarafından kullanılan difüzyon modelinin bir versiyonunu ve GPT-4’ün transformatör tabanlı motorundan güç alan Sora, istemlerin taleplerini yerine getiren yalnızca videolar üretmekle kalmıyor; aynı zamanda bunu sinematik grameri temel alarak da yapıyor. Öyle ki bu, bir hikayeyi anlatmak için olmazsa olmaz… Sora’nın en önemli diğer özelliği de girilen istemi parça parça üretip sonradan birleştirmemesi; tüm sahneyi tek seferde oluşturuyor.

SORA NASIL ÇALIŞIYOR?

Metinden inanılmaz ötesi görüntüler oluşturan Sora, kullanım açısından bildiğimiz diğer modeller gibi çalışıyor.

Genellikle bizler eski, parazitli, kimi zaman bulanık eski TV’leri ve çanak antenleri görmüşüzdür.

Görüntüyü netleştirmek için çanakta ince ayarlar yapmak yeterli olabiliyor. OpenAI’ın Sora yapay zekası da temelde bu şekilde çalışıyor. Sizin girdiğiniz prompt’u yani komutu, öncelikle analiz ederek anlamlandırıyor. Daha sonrasında ise analize dayanılarak akabinde bir senaryo oluşturuluyor.

Öte yandan senaryoya uygun sahneler üretiliyor ve üretim tek seferde gerçekleştiriliyor. Yukarıda da dediğimiz gibi, Sora, diğerleri gibi “bir sahne üret ve mükemmelleştir” yaklaşımını benimsemiyor. Tüm sahneyi, eğitim verisindeki her şeyiyle birlikte (yazılar, videolar, sesler, anlatımlar, araştırmalar, filmler, diziler vb.) değerlendirip, yorumlayıp tek seferde tüm sahneyi yaratabiliyor.

Peki sizler Sora hakkında neler düşünüyorsunuz? Yorumlarda belirtmeyi unutmayın…

Kaynak: OpenAI
Derleme: ANN Türkiye