Yapay zekâ çalışmalarına son dönemde ekstradan ağırlık veren teknoloji devi Meta, bir yandan sosyal ağ uygulamalarını yeniliklerle donatırken öte yandan da yapay zekâ yarışında rakiplerini nasıl geride bırakacağını düşünüyor. Bunun için bir yandan kendi çipini üretmenin yolunu ararken diğer yandan da yepyeni hizmetler duyuruyor.
Bunların en yenisi de OpenEQA oldu. Open-Vocabulary Embodied Question Answering şeklinde açılan bu teknoloji sayesinde yapay zekânın, etrafındaki alanları anlayabileceği söyleniyor. Açık kaynaklı yapısı sayesinde yeni teknoloji, yapay zekâ modellerine çevrelerinden ipucu toplayacakları duyular kazandırmayı hedefliyor.
Ofis kartınızı bulamıyor musunuz? Nerede olduğunu asistanınıza sorun.
- Kartını yemek masasında bıraktın, yiyecek kasesinin yanında.
Tek başına bir ürün olmaktan ziyade hâlihazırdaki bir araca beyin olan OpenEQA sistemi, bir ev robotu veya akıllı gözlükte hayat bularak bu araçların çevreyi anlayabilmesini sağlayacak. Sadece anlamakla kalmayacak olan bu sistem, çevre hakkındaki bilgileri gerektiği zaman kullanıcıya aktarabilecek.
Meta’nın sunduğu örnekler, sistemin kullanışlılığını ortaya koyuyor. Örneğin evden çıkacaksınız fakat ofis kartınızı bulamıyorsunuz. Akıllı gözlüklerinize kartınızı nerede unuttuğunuzu sorabileceksiniz. Gözlüğünüz de OpenEQA sisteminden aldığı görsel hafıza yeteneğiyle kartın, -örneğin- salondaki masanın üstünde olduğunu size söyleyebilecek.
- “Evet, yemek masasında biraz muz var.”
Ya da işten eve dönerken evinizdeki robota, evde yemek olup olmadığını sorabileceksiniz. Evi sürekli gezen robotunuz da gördüklerinden yola çıkarak yemek olup olmadığını size aktarabilecek.
Meta, günümüzdeki VLM’lerin (görsel dil modellerinin) sınırlı erişime sahip olması nedeniyle standart dil modellerinin pek de üzerine eklemediğini, bu sebeple de OpenEQA sistemini açık kaynak yaptıklarını duyurdu. Zira etrafını insanlar gibi görecek, neyin nerede olduğunu görüp aklında tutacak ve gerektiğinde bu bilgiyi insanlara aktaracak bir sistemin gerçek olması için çok sayıda uzmanın çalışması gerekecek. Sizin düşünceleriniz neler?