مایکروسافت نخستین مدل اختصاصی خود برای تولید تصویر با هوش مصنوعی را با نام «MAI-Image-1» که ماه گذشته معرفی شد، اکنون بهصورت رسمی در دو سرویس Bing Image Creator و Copilot Audio Expressions فعال کرده است. طبق توضیحات «مصطفی سلیمان»، مدیرعامل بخش AI مایکروسافت، این مدل در خلق تصاویر مربوط به غذا، طبیعت، نورپردازی هنری و جزئیات فوقواقعی عملکردی ممتاز دارد و کاربران از حالا میتوانند در بینگ و کوپایلوت از آن استفاده کنند؛ البته فعلاً این مدل برای کاربران اتحادیه اروپا فعال نیست.
مایکروسافت پیشتر در بلاگ رسمی خود تأکید کرده بود که MAI-Image-1 علاوهبر کیفیت فنی بالا در نورپردازی و خلق صحنههای طبیعی، از سرعت پردازش بسیار خوبی بهره میبرد. بنابراین کاربران این امکان را دارند که در کوتاهترین زمان، بهترین خروجیها را از ایدههای تصویری خود دریافت کنند و حتی تصاویر ساختهشده را با سرعت بالا ویرایش کنند.
بهنظر میرسد مایکروسافت با عرضه مدل اختصاصی خودش وارد مرحلهای تازه و جدیتر از رقابت مستقیم با گوگل و OpenAI شده است. سال ۱۴۰۴ احتمالا سالی خواهد بود که مدلهای مولد اختصاصی شرکتها تبدیل به مزیت رقابتی اصلی میشوند؛ چیزی شبیه جنگ پردازندهها در صنعت موبایل. شرکتی که مدل اختصاصی با کیفیتتر و سریعتر ارائه کند، نهتنها سهم بازار ابزارهای خلاقانه را تصاحب میکند، بلکه کنترل اکوسیستم تولید محتوا را هم به دست میگیرد. MAI-Image-1 یک قدم استراتژیک مهم برای مایکروسافت است؛ مخصوصاً اگر بتواند نسخههای تکاملیافتهتر این مدل را با دسترسی جهانیتر ارائه کند.
استقلال هوش مصنوعی مایکروسافت؛ گام تازه با MAI-Image-1 در کنار GPT-5 و DALL-E
مایکروسافت حالا قابلیت «حالت داستانی» را نیز برای مدل MAI-Image-1 فعال کرده است؛ قابلیتی که در بخش Copilot Audio Expressions به کار میرود و میتواند برای داستانهای صوتی تولیدشده توسط هوش مصنوعی، تصاویر هنری و مناسب روایت تولید کند. این اقدام، ادامه مسیر مایکروسافت در جهت توسعه مدلهای داخلی و کاهش وابستگی مستقیم به شرکای دیگر است. یادآوری میشود که مایکروسافت در ماه آگوست از اولین مدلهای اختصاصی خود شامل مدل صوتی MAI-Voice-1 و مدل متنی MAI-1-preview رونمایی کرده بود و اعلام کرده بود که این مدلها در بخشهای خاصی از کوپایلوت نیز بهکار گرفته خواهند شد.
البته این روند به معنای قطع رابطه با OpenAI نیست. مایکروسافت همچنان همزمان اعلام کرده که کوپایلوت در حال گذار به جدیدترین مدل OpenAI یعنی GPT-5 است و علاوهبر آن مدلهای Claude از شرکت Anthropic را نیز به کاربران ارائه میکند. در حال حاضر مدل MAI-Image-1 بهعنوان یکی از سه مدل هوش مصنوعی تولید تصویر در Bing Image Creator قابل انتخاب است و در کنار مدلهای DALL-E 3 و GPT-4o قرار گرفته است.
به نظر من این مسیر، یک استراتژی بلندمدت و حسابشده از طرف مایکروسافت است. آنها نمیخواهند ناگهان قطع ارتباط کنند، بلکه میخواهند به مرور ستون فقرات مدلهای بنیادی خودشان را بسازند تا اگر بازار یا روابط تجاری تغییر کرد، آسیب نبینند. آینده نزدیک دنیای هوش مصنوعی، ترکیبی از چندین مدل در کنار هم خواهد بود. شرکتهایی موفقتر خواهند بود که هم استقلال فنی داشته باشند و هم دسترسی باز به اکوسیستم مدلهای دیگر را حفظ کنند؛ و مایکروسافت دقیقاً در حال حرکت روی همین خط تعادل است.
