Film fragmanlarında seslendirme yapan kişilerden tutun metrodaki spikerlere kadar hayatımız yüzsüz seslerle dolu ve birçoğumuz bu seslerin sahiplerini merak edip onların görünüşlerini tahmin etmeye çalışmışızdır. MIT araştırmacıları bu durumu daha da ileriye taşıyıp, insanların sadece seslerini dinleyerek yapay bir istihbarat sistemi oluşturdu.

Yapay Zeka Uygulaması

Speech2Face adlı uygulama ile YouTube‘da bulunan milyonlarca insanın videoları kullanılarak sesler ve yüz özellikleri arasındaki ilişkiyi tanımak için oluşturulmuş derin bir sinir ağı geliştirildi. Bunu yaparken, konuşmacıların yaşı, cinsiyeti ve etnik kökeniyle birlikte başın şekli ve burnun genişliği gibi bazı özellikler göz önünde bulunduruldu.

Araştırmacılar daha sonra insanların seslerini sistemdeki ses kayıtlarıyla incelediğinde, her konuşmacının yüzünü uygun bir doğrulukla oluşturabildi.

yapay zeka

Açıkçası, bir kişinin sadece sesine göre, saç modelini, yüz tipini ve diğer fiziksel görünüm unsurlarını tahmin etmek imkansızdır. Bu nedenle araştırmacılar amaçlarını “tam yüzün tanınabilir bir görüntüsünü tahmin etmek yerine baskın olan özellikler bulmak ” olarak tanımlıyorlar.

Bununla birlikte, Speech2Face tarafından oluşturulan görüntüler genellikle yüz tipi için iyi bir eşleşme olmasına rağmen, sistem ara sıra hata verebiliyor.

Araştırmacılar, IEEE Xplore’de yayınlanan bir makalede, bu teknolojinin gelecekte kameralara ihtiyaç duymadan video görüşmeleri için yüz oluşturmak gibi bir uygulama olarak kullanılabileceğini söylüyor.

Kaynak: https://www.iflscience.com/technology/new-ai-figure-out-look-like-just-sound-voice/