گوگل لنز (Google Lens) اکنون این امکان را برای کاربران فراهم کرده است که با ضبط ویدیو به جستجو بپردازند و حتی از صدای خود برای پرسش درباره چیزهایی که مشاهده میکنند استفاده کنند. گوگل لنز می تواند بر روی گوشی های سامسونگ و گوشی اندرویدی دیگر اجرا شود. این قابلیت جستجو بر اساس ویدیو برای نخستین بار در ماه مه و در رویداد I/O معرفی شد. غول فناوری در آن زمان اعلام کرد که بهعنوان مثال، اگر شخصی درباره ماهیهای یک آکواریوم کنجکاو باشد، میتواند با برنامه Google Lens از آن ویدیو بگیرد و پرسشهایی نظیر «چرا این ماهیها با یکدیگر شنا میکنند؟» مطرح کند. سپس گوگل لنز با بهرهگیری از مدل Gemini AI به ارائه پاسخهای مربوطه به کاربر خواهد پرداخت.
امکان جستجو با ویدیو به گوگل لنز افزوده شد
«راجان پاتل»، معاون مهندسی گوگل، درباره این ویژگی به The Verge توضیح میدهد که گوگل ویدیو را بهعنوان مجموعهای از فریمهای تصویری ضبط میکند و «سپس از همان تکنیکهای بینایی رایانهای که پیشتر در لنز وجود داشته است، بهره میبرد.» بر اساس توضیحات پاتل، اطلاعات به یک مدل «سفارشی» از هوش مصنوعی جمینای منتقل میشود که برای «درک منظم چند فریم و سپس ارائه پاسخ از نتایج وب» طراحی شده است. این قابلیت هنوز قادر به شناسایی صداهای موجود در ویدیوها (مانند صدای پرندگان) نیست، اما پاتل اعلام میکند که گوگل در حال آزمایش این ویژگی است. در حال حاضر، کاربران میتوانند از این قابلیت در Search Labs بر روی دستگاههای اندروید و iOS استفاده کنند.
با این ویژگی جدید، میتوانید در حین ضبط ویدیو از هوش مصنوعی گوگل سوالاتی بپرسید و پاسخهای آنها را دریافت کنید. برای بهرهبرداری از این ویژگی، کافیست دوربین خود را به سمت سوژه بگیرید و در حین ضبط ویدیو، سوال خود را مطرح کنید. تا پیش از اضافهشدن این ویژگی، کاربران تنها میتوانستند سوالات خود را پس از گرفتن عکس در برنامه Google Lens تایپ کنند. اکنون قابلیت پرسشهای صوتی بهطور جهانی برای دستگاههای اندروید و iOS در دسترس قرار گرفته است، اما در حال حاضر فقط از زبان انگلیسی پشتیبانی میکند. اضافه شدن قابلیت پرسشهای صوتی به Google Lens، تحولی در تجربه کاربری این ابزار بهشمار میآید. این ویژگی میتواند روند جستجو را تسهیل کرده و امکان تعامل طبیعیتری با فناوری را فراهم آورد.
با این حال، محدودیت در پشتیبانی از زبانها نشاندهنده نیاز به توسعه و گسترش این قابلیت برای جذب کاربران در مناطق مختلف جهان است. بهنظر میرسد با افزودن زبانهای بیشتری، این ابزار میتواند به یک منبع ارزشمندتر برای کاربران در سرتاسر جهان تبدیل شود.