استارتاپ چینی دیپسیک اخیراً مدل هوش مصنوعی جدیدی به نام V3-0324 را معرفی کرده است که بهطور قابلتوجهی در حوزههایی مانند کدنویسی ارتقا یافته است. این مدل، با وجود عدم تبلیغات گسترده، به سرعت در حال رقابت با مدلهای مطرح آمریکایی مانند OpenAI و Anthropic است. بر اساس گزارشهای منتشر شده، این مدل بهطور متنباز با حجم 641 گیگابایت و مجوز MIT در پلتفرم Hugging Face در دسترس قرار گرفته است. از سوی دیگر، سرعت بالای مدل جدید دیپسیک، بهویژه با استفاده از مک استودیو با تراشه M3 Ultra، نشان میدهد که این مدل توانایی پردازش بیش از 20 توکن در ثانیه را دارد، هرچند که باید توجه داشت که استفاده از سیستمهای قدرتمند ممکن است معیار مناسبی برای ارزیابی عملکرد کلی مدل نباشد.
در مجموع، دیپسیک با این مدل جدید خود توانسته است یکی از رقبای جدی برای شرکتهای بزرگ آمریکایی محسوب شود. پیشرفتهای فنی و سرعت بالای این مدل، آن را به یکی از جذابترین گزینهها برای استفاده در برنامهها و پروژههای پیچیده تبدیل کرده است. در حالی که مدلهای مشابه از کمپانیهای بزرگ بهطور گسترده تبلیغ میشوند، این مدل چینی با انتشار بیسروصدا و بدون تبلیغات زیاد، ممکن است توجه بیشتری را به خود جلب کند.
مدل جدید DeepSeek V3-0324؛ پیشرفت چشمگیر با معماری نوآورانه
نسخه جدید مدل DeepSeek، تحت عنوان V3-0324، تحولی قابلتوجه در زمینه توانمندیهای مختلف از جمله کدنویسی بهوجود آورده است. اگرچه این ارتقاها به خودی خود شاید انقلابی نباشند، اما سرعت پیشرفت این شرکت در طی یک سال اخیر، بهویژه پس از انتشار نسخه اصلی V3 در دسامبر گذشته، قابلتوجه است. مدلهای جدید این شرکت، از جمله R1 که یک ماه بعد از V3 منتشر شد، به سرعت در حال توسعه هستند. اگرچه در برخی بنچمارکها این مدلها هنوز نتوانستهاند رقابت کاملی با مدلهای مطرحی مانند OpenAI و Anthropic داشته باشند، اما از نظر هزینهها بسیار مقرون بهصرفهتر هستند.
مدل V3-0324 از معماری خاصی به نام «ترکیب متخصصان» (MoE) استفاده میکند که در مقایسه با مدلهای زبانی معمولی تفاوت دارد. در حالی که در مدلهای سنتی تمام پارامترها بهطور همزمان برای انجام یک وظیفه فعال میشوند، در این مدل تنها حدود 37 میلیارد از 685 میلیارد پارامتر بهطور اختصاصی در هنگام انجام وظایف خاص فعال میشوند. این رویکرد موجب میشود تا مدل کارآمدتر و بهینهتر باشد.
از نظر من، پیشرفت DeepSeek نشاندهنده تغییرات مهم در نحوه توسعه مدلهای هوش مصنوعی است. اگرچه هنوز فاصلههایی با رقبا در برخی زمینهها وجود دارد، اما نوآوریهای این شرکت بهویژه در زمینه بهینهسازی منابع و هزینهها، میتواند آن را به یکی از گزینههای اصلی در بازار هوش مصنوعی تبدیل کند.