این غول فناوری همچنین مقالهای تحقیقاتی را منتشر کرده که جزئیات بیشتری در مورد این فناوری ارائه میدهد. تیم تحقیقاتی گوگل در مقالهای که از طریق arxiv.org منتشر شده است، بیان کردهاند:
(ما Imagen 3 را معرفی میکنیم، مدلی که میتواند از پیامهای متنی شما تصاویری با کیفیت بالا تولید کند.)
عرضه Imagen 3 در حالی صورت گرفته که بهتازگی نسخه بتای هوش مصنوعی Grok-2 نیز با قابلیت تولید تصویر در شبکه اجتماعی ایکس منتشر شده است.
عرضه مدل Imagen 3 از سوی گوگل نشاندهنده رقابت شدید در حوزه فناوریهای هوش مصنوعی است. این حرکت، بدون هیاهو و تبلیغات، اما با ارائه یک فناوری پیشرفته، نشان میدهد که گوگل به توسعه و بهبود مستمر قابلیتهای هوش مصنوعی خود اهمیت زیادی میدهد.
این مدل میتواند به کاربران امکان خلق تصاویر باکیفیت از طریق پیامهای متنی را بدهد که قابلیتهای خلاقانه جدیدی را به روی افراد و کسبوکارها باز میکند. ورود به عرصه تولید تصویر با استفاده از هوش مصنوعی، به ویژه در شرایطی که رقبایی مانند Grok-2 نیز فعال هستند، میتواند گوگل را در صدر نوآوریهای این حوزه نگه دارد.
نظر کاربران درباره هوش مصنوعی تولید تصویر گوگل
انتشار مدل Imagen 3 نشاندهنده یک حرکت استراتژیک گوگل در رقابت با سایر شرکتها در حوزه هوش مصنوعی است. با این حال، استقبال کاربران از این مدل متفاوت بوده است؛ برخی کاربران از بهبود کیفیت بافت و توانایی تشخیص کلمات Imagen 3 تمجید کردهاند، اما برخی دیگر از فیلترهای سختگیرانهای که برای تولید محتوا اعمال شده، ابراز ناامیدی کردهاند.
یکی از کاربران در Reddit نوشته است: «کیفیت تصاویر با بافتهای شگفتانگیز و تشخیص کلمات بسیار بهتر شده است، اما در حال حاضر فکر میکنم که Imagen 3 برای من نسبت به نسخه قبلی بدتر عمل میکند. این مدل از لحاظ فنی خوب است، اما من با خطاهای زیادی مواجه میشوم.»
بخش عمدهای از انتقادها به Imagen 3 مربوط به سانسورهای اعمالشده در آن است. بسیاری از کاربران میگویند که این مدل حتی درخواستهای ظاهراً بیضرر آنها را هم مسدود میکند. یکی از کاربران در این باره گفته است: «این مدل نیمی از ورودیهای من را رد میکند، و من حتی سعی ندارم کار احمقانهای انجام دهم.»
با ارائه عمومی مدلهای هوش مصنوعی تولید تصویر، این صنعت با پرسشهای جدی درباره نقش تعدیل محتوا، تعادل بین خلاقیت و مسئولیتپذیری، و تأثیر بالقوه این ابزارها بر گفتمان عمومی روبهرو شده است. ماههای آینده برای گوگل و xAI بسیار حیاتی خواهد بود، زیرا علاوه بر دریافت بازخورد کاربران، ممکن است با بررسیهای دقیقتری از سوی ناظران مواجه شوند.
Imagen 3 به عنوان یک مدل هوش مصنوعی قدرتمند، بدون شک پتانسیلهای زیادی برای پیشرفت دارد، اما چالشهای مطرحشده در رابطه با سانسور و فیلترهای محتوا نشان میدهد که هنوز نیاز به بهینهسازی بیشتری دارد. این موضوع در خصوص دیگر هوش های مصنوعی که برای مثال توسط سامسونگ و اپل یا شیائومی در گوشی های هوشمند عرضه شده است نیز صدق می کند.
این موضوع نه تنها به تجربه کاربری لطمه میزند، بلکه مسائل پیچیدهای را در رابطه با آزادی خلاقیت و مدیریت محتوا مطرح میکند. گوگل و سایر شرکتهای فعال در این حوزه باید تعادلی بین حفظ کیفیت و دقت مدلهای خود و احترام به خلاقیت و نوآوری کاربران برقرار کنند. آینده این تکنولوژی به توانایی شرکتها در پاسخگویی به این چالشها بستگی دارد.