Project Astra, Google’da Yapay Zeka’nın Geleceği

0
131
Project Astra, Google'da Yapay Zeka'nın Geleceği

Siri ve Alexa hiçbir zaman faydalı asistanlar olamadılar. Ancak Google ve diğerleri, yeni nesil botların gerçekten işe yarayacağına inanıyor.

David Pierce, kıdemli editör ve Vergecast eş sunucusu, tüketici teknolojisini on yılı aşkın süredir takip ediyor. Daha önce Protocol, The Wall Street Journal ve Wired’da çalıştı.

Google DeepMind’ın başkanı ve Google’ın yapay zeka çalışmalarının lideri Demis Hassabis, “Bu vizyonu uzun süredir aklımda taşıyorum” diyor. Hassabis, onlarca yıldır yapay zeka üzerinde düşünüyor ve çalışıyor, ancak dört veya beş yıl önce bir şey gerçekten netleşti. Yakında bir gün, diye fark etti, “Bu evrensel asistana sahip olacaktık. Çok modlu, her zaman yanınızda.” Star Trek Communicator deyin; Her’deki sese deyin; ne isterseniz deyin. “O yardımcıdır” diye devam ediyor Hassabis, “sadece faydalıdır. Ne zaman ihtiyacınız olursa yanında olduğuna alışırsınız.”

Şirketin yıllık geliştirici konferansı olan Google I/O’da Hassabis, o evrensel asistan olmasını umduğu şeyin çok erken bir versiyonunu gösterdi. Google buna Project Astra adını veriyor ve dünyayı görebilen, nesnelerin ne olduğunu ve nerede bıraktığınızı bilen, soruları yanıtlayabilen veya neredeyse her şeyi yapmanıza yardımcı olabilecek gerçek zamanlı, çok modlu bir yapay zeka asistanı. Hassabis’in hiçbir şekilde sahte veya doktorlu olmadığına yemin ettiği inanılmaz derecede etkileyici bir demo videosunda, Google’ın Londra ofisindeki bir Astra kullanıcısı, sisteme bir hoparlörün bir parçasını tanımlamasını, kayıp gözlüklerini bulmasını, kodu gözden geçirmesini ve daha fazlasını ister. Hepsi neredeyse gerçek zamanlı olarak ve çok konuşkan bir şekilde çalışıyor.

Astra, bu yılki I/O’daki birçok Gemini duyurusundan sadece biri. Özetleme ve altyazı ekleme gibi yaygın görevler için daha hızlı olması için tasarlanmış Gemini 1.5 Flash adlı yeni bir model var. Veo adlı başka bir yeni model, bir metin isteminden video oluşturabilir. Telefonunuz gibi cihazlarda yerel olarak kullanılmak üzere tasarlanan model olan Gemini Nano’nun da her zamankinden daha hızlı olduğu söyleniyor. Modelin belirli bir sorguda ne kadar bilgiyi dikkate alabileceğine atıfta bulunan Gemini Pro’nun bağlam penceresi 2 milyon jetona iki katına çıkıyor ve Google, modelin talimatları her zamankinden daha iyi takip ettiğini söylüyor. Google, hem modellerin kendileri hem de bunları kullanıcıların önüne çıkarma konusunda hızlı ilerleme kaydediyor.

Astra, tasarım gereği çok modludur – onunla sohbet etmek için konuşabilir, yazabilir, çizebilir, fotoğraf çekebilir ve video çekebilirsiniz.

Hassabis, bundan sonra yapay zekanın hikayesinin modellerin kendilerinden çok sizin için neler yapabilecekleriyle ilgili olacağını söylüyor. Ve bu hikaye tamamen ajanlarla ilgili: sadece sizinle konuşmakla kalmayıp sizin adınıza gerçekten bir şeyler başaran botlar. “Ajanlardaki tarihimiz, genelleştirilmiş model çalışmamızdan daha uzun” diyor, yaklaşık on yıl önceki oyun oynayan AlphaGo sistemine işaret ederek. Bu aracıların bazılarının, işleri halletmek için ultra basit araçlar olacağını, bazılarının ise daha çok işbirlikçi ve arkadaş gibi olacağını hayal ediyor. “Sanırım bir noktada kişisel tercihe bile bağlı olabilir” diyor, “ve bağlamınızı anlamak.”

Hassabis, Astra’nın, gerçek bir gerçek zamanlı yapay zeka asistanının çalışma şekline önceki ürünlerden çok daha yakın olduğunu söylüyor. Google’ın ana akım büyük dil modelinin en son sürümü olan Gemini 1.5 Pro hazır olduğunda, Hassabis, temeldeki teknolojinin Astra gibi bir şeyin iyi çalışmaya başlaması için yeterince iyi olduğunu bildiğini söylüyor. Ancak model ürünün sadece bir parçası. “Bunun bileşenlerine altı ay önce sahiptik” diyor, “ancak sorunlardan biri sadece hız ve gecikmeydi. Bu olmadan, kullanılabilirlik tam olarak orada değil.” Bu nedenle, altı ay boyunca sistemi hızlandırmak ekibin en önemli görevlerinden biri oldu. Bu, modeli iyileştirmek anlamına geliyordu, aynı zamanda altyapının geri kalanını da iyi ve ölçekte çalışacak şekilde optimize etmek anlamına geliyordu. Neyse ki, Hassabis gülerek, “Bu Google’ın çok iyi yaptığı bir şey!” diyor.

Google’ın I/O’daki yapay zeka duyurularının çoğu, size Gemini’yi kullanmanın daha fazla ve daha kolay yolunu sunmakla ilgili. Gemini Live adlı yeni bir ürün, modelle kolayca sohbet etmenizi, uzun uzadıya konuştuğunda onu kesmenizi veya konuşmanın önceki bölümlerine geri dönmenizi sağlayan yalnızca sesli bir asistandır. Google Lens’teki yeni bir özellik, bir videoyu çekip anlatarak web’de arama yapmanızı sağlar. Bunların çoğu, Gemini’nin geniş bağlam penceresi tarafından etkinleştirilir, bu da aynı anda çok büyük miktarda bilgiye erişebileceği anlamına gelir ve Hassabis, asistanınızla etkileşimin normal ve doğal hissettirmesi için bunun çok önemli olduğunu söylüyor.

Gemini 1.5 Flash, her şeyden önce yapay zeka asistanlarını daha hızlı hale getirmek için var.

Bu arada, bu değerlendirmeye kimin katıldığını biliyor musunuz? Bir süredir yapay zeka ajanları hakkında konuşan OpenAI. Aslında şirket, Hassabis ile sohbet ettikten neredeyse bir saat sonra Gemini Live’a çarpıcı biçimde benzeyen bir ürünün demosunu yaptı. İki şirket giderek aynı bölge için savaşıyor ve yapay zekanın hayatınızı nasıl değiştirebileceği ve zaman içinde onu nasıl kullanabileceğiniz konusunda ortak bir vizyonu paylaşıyor gibi görünüyor.

Bu asistanlar tam olarak nasıl çalışacak ve onları nasıl kullanacaksınız? Kimse kesin olarak bilmiyor, Hassabis bile. Google’ın şu anda odaklandığı bir şey gezi planlaması – daha sonra asistanla birlikte düzenleyebileceğiniz tatiliniz için bir güzergah oluşturmak için Gemini’yi kullanmak için yeni bir araç oluşturdu. Sonunda buna benzer daha birçok özellik olacak. Hassabis, bu aracılar için kilit cihazlar olarak telefonlar ve gözlükler konusunda iyimser olduğunu söylüyor, ancak “bazı heyecan verici form faktörleri için muhtemelen yer var” diyor. Astra hala erken bir prototip aşamasındadır ve Gemini gibi bir sistemle etkileşim kurmak isteyebileceğiniz tek bir yolu temsil eder. DeepMind ekibi, çok modlu modelleri en iyi nasıl bir araya getireceklerini ve ultra büyük genel modelleri daha küçük ve daha odaklı modellerle nasıl dengeleyeceklerini hâlâ araştırıyor.

Hala yapay zekanın “hızlar ve beslemeler” çağındayız, burada her artımlı model önemli ve parametre boyutlarına takıntılıyız. Ancak çok hızlı bir şekilde, en azından Hassabis’e göre, yapay zeka hakkında farklı sorular sormaya başlayacağız. Daha iyi sorular. Bu asistanların neler yapabileceği, bunu nasıl yaptıkları ve hayatlarımızı nasıl daha iyi hale getirebilecekleri hakkında sorular. Çünkü teknoloji mükemmel olmaktan çok uzak ama çok hızlı bir şekilde gelişiyor.

Yorum Yapın