خرید اقساطی از سایت کارت با کمترین پیش پرداخت

معرفی MAI-Image-1؛ مدل هوش مصنوعی تصویرساز مایکروسافت در Bing و Copilot


avatar
نازنین طالب لو
17 آبان 1404 | 3 دقیقه مطالعه

مایکروسافت نخستین مدل اختصاصی خود برای تولید تصویر با هوش مصنوعی را با نام «MAI-Image-1» که ماه گذشته معرفی شد، اکنون به‌صورت رسمی در دو سرویس Bing Image Creator و Copilot Audio Expressions فعال کرده است. طبق توضیحات «مصطفی سلیمان»، مدیرعامل بخش AI مایکروسافت، این مدل در خلق تصاویر مربوط به غذا، طبیعت، نورپردازی هنری و جزئیات فوق‌واقعی عملکردی ممتاز دارد و کاربران از حالا می‌توانند در بینگ و کوپایلوت از آن استفاده کنند؛ البته فعلاً این مدل برای کاربران اتحادیه اروپا فعال نیست.

مایکروسافت پیش‌تر در بلاگ رسمی خود تأکید کرده بود که MAI-Image-1 علاوه‌بر کیفیت فنی بالا در نورپردازی و خلق صحنه‌های طبیعی، از سرعت پردازش بسیار خوبی بهره می‌برد. بنابراین کاربران این امکان را دارند که در کوتاه‌ترین زمان، بهترین خروجی‌ها را از ایده‌های تصویری خود دریافت کنند و حتی تصاویر ساخته‌شده را با سرعت بالا ویرایش کنند.

به‌نظر می‌رسد مایکروسافت با عرضه مدل اختصاصی خودش وارد مرحله‌ای تازه و جدی‌تر از رقابت مستقیم با گوگل و OpenAI  شده است. سال ۱۴۰۴ احتمالا سالی خواهد بود که مدل‌های مولد اختصاصی شرکت‌ها تبدیل به مزیت رقابتی اصلی می‌شوند؛ چیزی شبیه جنگ پردازنده‌ها در صنعت موبایل. شرکتی که مدل اختصاصی با کیفیت‌تر و سریع‌تر ارائه کند، نه‌تنها سهم بازار ابزارهای خلاقانه را تصاحب می‌کند، بلکه کنترل اکوسیستم تولید محتوا را هم به دست می‌گیرد.  MAI-Image-1  یک قدم استراتژیک مهم برای مایکروسافت است؛ مخصوصاً اگر بتواند نسخه‌های تکامل‌یافته‌تر این مدل را با دسترسی جهانی‌تر ارائه کند.

استقلال هوش مصنوعی مایکروسافت؛ گام تازه با MAI-Image-1 در کنار GPT-5 و DALL-E

مایکروسافت حالا قابلیت «حالت داستانی» را نیز برای مدل MAI-Image-1 فعال کرده است؛ قابلیتی که در بخش  Copilot Audio Expressions  به کار می‌رود و می‌تواند برای داستان‌های صوتی تولیدشده توسط هوش مصنوعی، تصاویر هنری و مناسب روایت تولید کند. این اقدام، ادامه مسیر مایکروسافت در جهت توسعه مدل‌های داخلی و کاهش وابستگی مستقیم به شرکای دیگر است. یادآوری می‌شود که مایکروسافت در ماه آگوست از اولین مدل‌های اختصاصی خود شامل مدل صوتی MAI-Voice-1 و مدل متنی MAI-1-preview رونمایی کرده بود و اعلام کرده بود که این مدل‌ها در بخش‌های خاصی از کوپایلوت نیز به‌کار گرفته خواهند شد.

البته این روند به معنای قطع رابطه با OpenAI نیست. مایکروسافت همچنان هم‌زمان اعلام کرده که کوپایلوت در حال گذار به جدیدترین مدل OpenAI یعنی GPT-5 است و علاوه‌بر آن مدل‌های Claude از شرکت Anthropic را نیز به کاربران ارائه می‌کند. در حال حاضر مدل MAI-Image-1 به‌عنوان یکی از سه مدل هوش مصنوعی تولید تصویر در Bing Image Creator  قابل انتخاب است و در کنار مدل‌های DALL-E 3 و GPT-4o قرار گرفته است.

به نظر من این مسیر، یک استراتژی بلندمدت و حساب‌شده از طرف مایکروسافت است. آن‌ها نمی‌خواهند ناگهان قطع ارتباط کنند، بلکه می‌خواهند به مرور ستون فقرات مدل‌های بنیادی خودشان را بسازند تا اگر بازار یا روابط تجاری تغییر کرد، آسیب نبینند. آینده‌ نزدیک دنیای هوش مصنوعی، ترکیبی از چندین مدل در کنار هم خواهد بود. شرکت‌هایی موفق‌تر خواهند بود که هم استقلال فنی داشته باشند و هم دسترسی باز به اکوسیستم مدل‌های دیگر را حفظ کنند؛ و مایکروسافت دقیقاً در حال حرکت روی همین خط تعادل است.