Meta'nın Ray-Ban Gözlükleri Sizin Gördüğünüzü Görebilen Yapay Zekayı Ekledi

Meta'nın Ray-Ban Gözlükleri Sizin Gördüğünüzü Görebilen Yapay Zekayı Ekledi

Bu Ray-Ban AI gözlüklerini denedim ve oldukça çılgınlar. Deneysel özelliğin nasıl çalıştığı aşağıda açıklanmıştır. 

Eller, çerçevelerin köşelerinde Meta ve Ray-Ban yapımı, kameralar bulunan gri bir güneş gözlüğü tutuyor

"Hey Meta. Şuna bir bak ve bana bu çaylardan hangisinin kafeinsiz olduğunu söyle."

Bu sözleri, teknoloji devinin New York'taki genel merkezinde bir çift Meta Ray-Ban giyerken, kafein etiketleri Magic Marker ile karartılmış dört çay paketinin bulunduğu masaya bakarken söyledim. Kulaklarımdaki küçük bir tıklama sesini, Meta'nın yapay zeka sesinin bana papatya çayının muhtemelen kafeinsiz olduğunu söylemesi takip etti. Etiketleri okuyor ve üretken yapay zekayı kullanarak kararlar veriyordu.

Bugünden itibaren Meta'nın ikinci nesil Ray-Ban gözlüklerine sunulacak bir özelliğin tanıtımını yapıyordum; bu, Meta CEO'su Mark Zuckerberg'in Eylül ayında yeni gözlükler duyurulduğunda zaten söz verdiği bir özellikti. Görüntülere bakmak ve bunları üretken yapay zeka ile yorumlamak için Meta'nın gözlük üstü kameralarına erişebilen yapay zeka özelliklerinin 2024'te piyasaya sürülmesi gerekiyordu. Erken erişim modu olmasına rağmen Meta, bu özellikleri beklediğimden çok daha hızlı tanıtmak için harekete geçti. hala bir beta. Gözlüklerin halihazırda mevcut ses özellikli özelliklerinin gücünü artıran yeni bir güncellemenin parçası olarak Bing destekli aramanın Ray-Bans'e eklenmesiyle birlikte Meta'nın gözlükleri, hızla bir dizi yeni yetenek kazanmaya başlıyor.

Demo beni oldukça şaşırttı çünkü daha önce hiç böyle bir şey görmemiştim. Bazı kısımlarım var: Google Lens ve diğer telefon araçları halihazırda kameraları ve yapay zekayı birlikte kullanıyor ve  Google Glass  - on yıl önce - bazı çeviri araçlarına sahipti. Bununla birlikte, Meta'nın gözlüklerinin, etrafımdaki dünyadaki şeyleri tanımlamak için yapay zekayı çağıran kolay erişim yöntemi oldukça gelişmiş hissettiriyor. Daha fazlasını deneyeceğim için heyecanlıyım.

İtalyanca bir restoran tabelası, üstünde ve altında bir yapay zeka asistanının çeviri yapmasını isteyen başlıklar

Gözlüklerin ekranı yok ve yalnızca yanıtları söylüyor. Ancak Meta View telefon uygulaması, fotoğrafları ve AI yanıtlarını daha sonra kullanmak üzere kaydeder.

Meta

Multimodal AI: Şu anda nasıl çalışıyor?

Özelliğin şu anda sınırları var. Yalnızca bir fotoğraf çekerek gördüğünüzü tanıyabilir ve daha sonra yapay zeka bunu analiz eder. Sesli istekte bulunduktan sonra deklanşörün sesini duyabiliyorsunuz ve yanıt gelmeden önce birkaç saniyelik bir duraklama oluyor. Sesli uyarılar da uzun uzun: Meta gözlüklerdeki her sesli isteğin "Hey, Meta" ile başlaması gerekiyor. ve ardından fotoğraf çekmeyi tetiklemek için "Şuna bir göz atın" demeniz ve hemen ardından yapay zekadan yapmasını istediğiniz şeyi yapmanız gerekir. "Hey Meta, şuna bir bak ve bana bu malzemelerle bir tarif söyle." "Hey Meta, şuna bir bak ve komik bir başlık yaz." "Hey Meta, şuna bir bak. Hangi bitki bu?"

Bir yapay zeka asistanından yemek pişirme konusunda yardım isteyen altyazıların yer aldığı, ızgara yaparken çekilmiş bir fotoğraf

Henüz yemek pişirirken Meta'nın gözlüklerini denemedim.

Yardımcı amaçlarla da olası kullanımları olabilir. Reçetemin olmadığı bir çift Meta gözlüğü taktım ve ona neye baktığımı sordum. Cevaplar ayrıntı ve doğruluk açısından farklılık gösterebilir, ancak bir uyarı verebilir. Ona mavimsi camlı (mavi-siyah çerçeveli, oldukça yakın) gözlüklerimi gösterdiğimi biliyordu. 

Bazen halüsinasyon görebilir. Bardaklara önümdeki kasedeki meyveleri sordum, portakal, muz, yusufçuk, elma ve nar olduğunu söyledi. Narlar dışında doğruydu. (Bunların hiçbiri yoktu.) Benden pencerenin önünde duran büyük bir doldurulmuş pandaya başlık yazmam istendi. Bazı sevimli şeyler vardı ama biri yalnız olan birinin telefona bakmasıyla ilgiliydi ki bu da birbiriyle pek uyuşmuyordu.

İspanyolca bir menüye baktım ve bardaklardan bana baharatlı yemekleri göstermesini istedim. Benim için bazı yemekleri okudu ve bazı temel malzemeleri tercüme etti, ancak etli yemekler hakkında tekrar sordum ve her şeyi İspanyolca olarak okudu.

Buradaki olasılıklar çok vahşi ve büyüleyici ve muhtemelen inanılmaz derecede faydalı. Meta, bu erken lansmanın hataların keşfedilmesi ve gözlükteki yapay zekanın çalışma şeklinin geliştirilmesine yardımcı olacağını kabul ediyor. Çok fazla "Hey Meta, şuna bak" anlarının olduğunu fark ettim. Ama bu süreç değişebilir, kim bilir. Anında görüntü analizi yaparken, doğrudan takip soruları sormak, tekrar "Şuna bak" demeden işe yarayabilir, ancak başarımın değişeceğinden eminim.

Baloncuklarla birlikte bir dağı işaret eden bir el, yapay zekadan fotoğrafa altyazı eklemeye yardım etmesini istiyor

Altyazılar ne zaman faydalı olacak ve ne zaman halüsinasyon görecekler?

Giyilebilir yapay zekanın geleceği ilginçleşiyor

Meta'nın kameraları ve sesli sohbeti birlikte kullandığı için "çok modlu yapay zeka" olarak adlandırdığı bu yapay zeka, şirketin daha fazla duyusal veri de dahil olmak üzere birçok girdi biçimini karıştırmayı planladığı gelecekteki yapay zekanın öncüsü. Qualcomm'un Meta'nın yeni Ray-Ban'leri üzerindeki yapay zeka odaklı yonga seti şimdiden daha fazlasını üstlenmeye hazır görünüyor. Bu aynı zamanda Meta'nın zamanla daha kusursuz hale getirmeyi planladığı bir süreçtir. 

Meta CTO Andrew Bosworth Eylül ayında bana, gözlüklerin artık pil ömrünü tüketmemeleri için etkinleştirilmesi ve "görülmesi" için bir sesli uyarıya ihtiyaç duyduğunu, ancak eninde sonunda "gözlüklerin yeterince düşük güçte sensörlere sahip olacağını" söyledi. Yapay zekayı tetikleyen bir farkındalığı tetikleyen bir olayı tespit edebiliyoruz. Bu gerçekten üzerinde çalıştığımız hayal." Meta aynı zamanda gelecekteki daha gelişmiş giyilebilir cihazlar öncesinde birden fazla duyusal veri biçimini bir araya getiren yapay zeka araçlarını da araştırıyor.

Şu anda bunun bir erken erişim betası olduğunu bilin. Meta, erken erişim aşamasında AI hizmetlerini geliştirmeye yardımcı olmak için anonimleştirilmiş sorgu verilerini kullanıyor ve bu da daha fazla gizlilik isteyen insanları endişelendirebilir. Henüz spesifik katılım ayrıntılarını bilmiyorum, ancak veri paylaşımına ilişkin daha ayrık kontroller, muhtemelen gelecek yıl nihai AI özellikleri piyasaya sürüldüğünde uygulamaya konabilecek gibi görünüyor.

Bunların hepsi bana henüz şahsen görmediğim bir cihaz olan giyilebilir AI Pin ile Humane'nin tam olarak neyi hedeflediğini hatırlatıyor . Human'ın ürünü pahalı ve kıyafet üzerine giyilmesi gerekiyorken, Meta'nın gözlükleri 300 dolar ve halihazırda mağaza raflarında. Saatler, VR kulaklıklar ve akıllı gözlükler yapay zeka yeteneklerini geliştirdikçe, giyilebilir teknolojinin geleceği ve yardımcı farkındalık düzeyi açısından işler çok farklılaşabilir.

Giyilebilir yapay zeka ürünlerinde yeni bir sınırın halihazırda yolda olduğu ve Meta'nın gözlüklerinin buraya ilk olarak geldiği açıkça görülüyor.