Google Luncurkan Fitur “Video Real-Time” di Gemini, Asisten AI Kini Bisa Melihat Lewat Kamera

Last Updated: 25 Maret 2025By Ikhwanul MufidTags: berita Indonesia, teknologi

Google kembali membuat gebrakan dengan memperkenalkan fitur terbaru bertajuk “Video Real-Time” pada layanan AI generatifnya, Gemini. Lewat inovasi ini, pengguna bisa berinteraksi langsung dengan AI melalui kamera ponsel mereka — layaknya berbicara dengan asisten pribadi yang bisa melihat lingkungan sekitar Anda secara langsung.

Gemini Kini Bisa Melihat Dunia Nyata dari Kamera Anda

Mengutip laporan dari The Verge (Senin, [tanggal]), fitur ini memungkinkan Gemini untuk mengakses kamera pengguna, menganalisis gambar secara real-time, lalu merespons secara cerdas sesuai konteks visual yang ditangkap.

Contohnya, jika Anda menunjukkan sebuah buku ke kamera, Gemini dapat memberikan informasi seputar judul, penulis, hingga ringkasan isi buku tersebut. Interaksi ini membuka jalan baru dalam dunia AI yang tak hanya sekadar berbicara, tapi juga mampu memahami visual.

Juru bicara Google, Alex Joseph, membenarkan kehadiran fitur ini melalui pernyataan email kepada The Verge. Ia menyebut bahwa fitur “Video Real-Time” merupakan bagian dari pengembangan Proyek Astra — inisiatif riset Google yang bertujuan menciptakan asisten AI dengan kesadaran kontekstual terhadap lingkungan pengguna.

Awalnya Ditemukan Pengguna Xiaomi, Kini Viral di Reddit

Menariknya, fitur ini pertama kali terdeteksi bukan lewat pengumuman resmi, melainkan dari seorang pengguna Xiaomi yang membagikan pengalamannya di forum Reddit. Dalam unggahannya, ia memperlihatkan bagaimana Gemini mampu membaca teks di layar secara akurat hanya dengan bantuan kamera.

Tak lama, pengguna lain pun ikut mengunggah video serupa, memperlihatkan kapabilitas Gemini dalam mengenali objek serta menjawab pertanyaan berbasis visual. Fenomena ini menjadi viral dan menuai berbagai reaksi positif dari komunitas teknologi.

Kemampuan membaca teks secara langsung ini juga sesuai dengan yang dijanjikan Google saat tampil di Mobile World Congress (MWC) 2025, di mana mereka memamerkan dua fitur utama untuk Gemini Advanced, salah satunya adalah interaksi berbasis video ini.

Begini Cara Menggunakan Fitur “Video Real-Time” di Gemini

Mengaktifkan fitur ini cukup mudah. Pengguna hanya perlu membuka aplikasi Gemini dan mengizinkan akses kamera. Setelah itu, AI akan menganalisis gambar atau objek di sekitar pengguna, lalu memberikan respons secara instan berdasarkan pertanyaan yang diajukan.

Google juga telah merilis video demo resmi fitur ini yang ditayangkan bersamaan dengan pengumuman di MWC 2025, memperlihatkan berbagai skenario penggunaan — dari membaca label makanan, menerjemahkan teks asing, hingga mengidentifikasi produk hanya dalam hitungan detik.

Google Selangkah Lebih Maju dari Kompetitor

Langkah agresif Google lewat fitur baru ini membuat pesaing seperti Amazon dan Apple tampak tertinggal. Sementara Alexa Plus dari Amazon masih dalam tahap uji terbatas, dan Siri dari Apple belum mendapat pembaruan besar, Google justru telah melangkah ke era baru AI: dari suara ke visual.

Dengan kehadiran Proyek Astra, Google ingin membuktikan bahwa AI generatif tidak hanya bisa mendengar dan berbicara, tapi juga melihat dan memahami secara kontekstual — membawa pengalaman pengguna ke level berikutnya.

Saat ini, fitur “Video Real-Time” mulai dirilis secara bertahap untuk pengguna Gemini Advanced, dan diprediksi akan menjadi standar baru dalam interaksi manusia dengan AI.

Sumber : ANTARA

Berita selengkapnya dapat Anda akses melalui aruna9news.com