Alibaba Group, fotoğrafları videoya dönüştürüp seslendirebilen EMO adlı yapay zekâ aracını tanıttı.
Yapay zekâ teknolojisi sürekli olarak yeni özelliklerle gelişmeye devam ediyor. En sonuncusu olan EMO, tek bir referans görsel kullanarak video oluşturabilme yeteneğine sahip.
Video oluşturma konusunda birçok yapay zekâ modeli bulunsa da, EMO öne çıkıyor çünkü referans görseli sesle birleştirerek gerçekçi videolar üretebiliyor. EMO tarafından oluşturulan videolarda insan hareketleri ve mimikleri özellikle dikkat çekiyor. Ayrıca EMO’nun sesle uyumlu olarak eklenen ağız hareketleri, videoların gerçekçiliğini artırıyor.
EMO’nun önemli bir özelliği de ses kaynağındaki tempoyu algılayabilmesidir. Yavaş veya hızlı konuşma arasındaki farkı profesyonelce değerlendirerek görüntüyü buna göre oluşturabilme yeteneğine sahiptir. Bu esnada, referans görsel gerçek bir kişi olmak zorunda değildir; EMO, kurgusal karakterleri de başarılı bir şekilde konuşturabilmektedir.
Yapay zekâ modeli, iki aşamadan oluşmaktadır. İlk aşamada, referans görselden hareketli videolar oluşturulurken ikinci aşama, ses dosyasını inceleyerek önemli kısımları tespit eder. Son olarak, tespit edilen ses dosyası videoyla birleştirilir. Ayrıca, yapay zekânın iki kontrol merkezi bulunmaktadır: biri görseldeki resmin tutarlılığını kontrol ederken diğeri sesle ilgili kısmı denetler.
Alibaba Group Tarafından Geliştirilen
EMO Yapay Zekası herhangi bir
fotoğrafı videoya dönüştürürken
bu videoları seslendirebiliyor.Karakter: Joaquin Rafael Phoenix – The Joker – 《Jocker 2019》
Seslendirilen ses : 《The Dark Knight》 Joker 2008#yapayzeka #ai #tasarım pic.twitter.com/ZXBaeoRoqj— Üçüncü Binyıl Akademi (@UcuncuBinyil) March 6, 2024
Etiket:Alibaba Grubu, EMO yapay zekâ aracı, Fotoğraf, Kontrol merkezleri, Kurgusal karakterler, Mimiklerin gerçekçiliği, Referans görsel, Ses kaynağı temposu, Sesli video oluşturma, Teknoloji Haberleri, video dönüştürme, Video oluşturma teknolojisi, Videolarda insan hareketleri, Yapay zeka teknolojisi, Yavaş ve hızlı konuşma algılama