گوگل مدل پیشرفته هوش مصنوعی تولید تصویر Imagen 3 خود را به مجموعه قابلیتهای Gemini اضافه کرده است. از این پس، کاربران Gemini نیز مانند کاربران ChatGPT که از DALL-E بهره میبرند، میتوانند به کمک دستیار هوش مصنوعی گوگل تصاویر تولید کنند.
گوگل از طریق حساب رسمی Gemini در شبکه اجتماعی X اعلام کرده است: (تولید تصویر با Imagen 3 اکنون برای تمام کاربران Gemini در سراسر جهان در دسترس است. Imagen 3 پیشرفتهترین مدل تولید تصویر ما تا به امروز است و باکیفیتترین تصاویر را با دقت بالا، رعایت قوانین و حداقل خطا ارائه میکند.)
محدودیتهای Gemini در تولید تصاویر
طبق گزارشها، قابلیت تولید تصویر با Gemini در حال حاضر با محدودیتهایی همراه است. به عنوان مثال، کاربران نمیتوانند تصاویر افراد مشهور و شناختهشده را تولید کنند. این قابلیت فعلاً به صورت دسترسی زودهنگام برای مشترکین نسخه Gemini Advanced با هزینه ماهانه ۱۹.۹۹ دلار در دسترس است. یکی از ویژگیهای کلیدی که گوگل در Imagen 3 بر آن تمرکز کرده، ایجاد تصاویر با فوتورئالیسم بالاست. این تمرکز باعث شده تا عکسهای تولیدشده با این مدل، نورپردازیهای بسیار دقیق و طبیعی داشته باشند و کاربران بتوانند تصاویری نزدیک به واقعیت خلق کنند.
Imagen 3 که اولین بار در رویداد Google I/O 2024 معرفی شد، پیشتر از طریق سرویس AI Test Kitchen گوگل در دسترس بود. اما حالا با اضافه شدن آن به Gemini، گوگل در تلاش است تا افراد بیشتری را به تجربه قابلیتهای هوش مصنوعی تولید تصویر خود با کالا های دیجیتال دعوت کند. محدودیتهای اولیهای که برای تولید تصاویر از افراد مشهور در Gemini وجود دارد، قابل درک است، بهویژه از نظر حفظ حریم خصوصی و مسائل حقوقی. با این حال، قابلیت تولید تصاویر با فوتورئالیسم دقیق، یک گام بزرگ در دنیای هوش مصنوعی به شمار میرود. این پیشرفت میتواند به کاربران ابزارهای خلاقانهتری ارائه دهد، اما باید مراقب باشیم که این فناوری چگونه مورد استفاده قرار میگیرد تا از سوءاستفادهها جلوگیری شود. قیمت اشتراک نیز به نظر میرسد کمی بالا باشد، اما احتمالاً به تدریج با گسترش کاربران و بهبود فناوریها، مقرونبهصرفهتر خواهد شد.