Google, Chrome tarayıcısına gelecek yeni bir güncellemeyle birlikte yapay zeka asistanı Gemini'nin ekran içeriğini gerçek zamanlı olarak algılayıp analiz edebilmesini sağlayacak. Şirketin yayınladığı teknik dokümanlara göre, bu özellik sayesinde kullanıcıların tarayıcıda görüntüledikleri sayfalardaki metin, görsel ve videolar hakkında anında bilgi alması mümkün olacak. Güncelleme, önümüzdeki aylarda kademeli olarak kullanıma sunulacak.
Yeni özellik nasıl çalışacak?
Gemini'nin ekran algılama özelliği, Chrome'un arka planda çalışan bir eklentisi olarak tasarlandı. Kullanıcı izni alındıktan sonra, tarayıcı aktif bir sayfadayken Gemini, ekranın bir kısmını veya tamamını anlık olarak işleyebilecek. Örneğin, bir alışveriş sitesinde bir ürüne bakarken Gemini, ürünün özelliklerini, fiyat karşılaştırmalarını veya kullanıcı yorumlarını özetleyebilecek. Benzer şekilde, bir haber makalesi okurken fotoğrafları tanımlayıp bağlamsal bilgiler sunabilecek.
Gizlilik ve güvenlik adımları
Google, yeni özelliğin gizlilik endişelerini gidermek için çeşitli önlemler aldığını duyurdu. İlk olarak, özellik varsayılan olarak kapalı gelecek ve kullanıcıların manuel olarak etkinleştirmesi gerekecek. İkinci olarak, tüm görüntü işleme işlemleri cihaz üzerinde (on-device) gerçekleştirilecek ve hiçbir görüntü Google sunucularına gönderilmeyecek. Üçüncü olarak, kullanıcılar istedikleri zaman özelliği devre dışı bırakabilecek ve geçmiş kayıtlarını silebilecek. Şirket, bu adımlarla kullanıcı mahremiyetini korumayı hedefliyor.
Gemini'nin bu yeni yeteneği, Google'ın yapay zeka asistanını daha proaktif hale getirme stratejisinin bir parçası olarak görülüyor. Geçtiğimiz yıl tanıtılan Gemini, başlangıçta yalnızca metin tabanlı sorgulara yanıt veriyordu. Ardından görsel tanıma ve çok modlu yetenekler kazandı. Şimdi ise ekran içeriğini anlık olarak işleyerek kullanıcıya gerçek zamanlı yardım sunmayı amaçlıyor.
Uzmanlar, bu özelliğin özellikle erişilebilirlik alanında önemli faydalar sağlayabileceğini belirtiyor. Görme engelli kullanıcılar için ekran okuyucularla entegre çalışarak, sayfadaki görselleri sesli olarak tanımlayabilecek. Aynı zamanda, karmaşık görsel bilgiler içeren sayfaları (grafik, tablo vb.) anlamlandırmakta zorlanan kullanıcılara da destek olabilecek.
Google'ın bu hamlesi, yapay zeka asistanları arasındaki rekabeti de kızıştıracak. Microsoft, Edge tarayıcısında Copilot ile benzer ekran okuma özellikleri sunarken, Apple'ın Safari tarayıcısındaki Siri ise henüz bu seviyede bir yeteneğe sahip değil. Pazar araştırma şirketi Gartner'a göre, 2025 yılına kadar tarayıcı tabanlı yapay zeka asistanlarının kullanımı %150 artacak.
Kullanıcıların yeni özelliği test etmek için Chrome'un Beta veya Canary sürümlerine erişmesi gerekiyor. Özellik, öncelikle İngilizce dil desteğiyle başlayacak, ardından diğer dillere genişletilecek. Google, Türkçe dil desteği için net bir tarih vermemiş olsa da, genellikle büyük güncellemelerden sonra birkaç ay içinde eklendiği görülüyor.
Sonuç olarak, Google Chrome'un Gemini entegrasyonu, tarayıcı deneyimini dönüştürme potansiyeline sahip. Ancak kullanıcıların bu tür bir yeteneği benimsemesi için gizlilik kaygılarının giderilmesi ve özelliğin gerçekten işe yaradığını görmeleri gerekiyor. Google'ın şeffaflık ve kullanıcı kontrolü konusundaki vaatleri, bu süreçte belirleyici olacak. Yapay zekanın tarayıcılardaki varlığı giderek artarken, kullanıcıların da bu teknolojiyi nasıl kullanacaklarına dair bilinçli seçimler yapmaları önem kazanıyor.