خرید اقساطی از سایت کارت با کمترین پیش پرداخت

دسته‌بندی‌ها:

تراشه اطلس از Positron؛ چالشی تازه برای انویدیا H200 با قدرت بیشتر و مصرف کمتر

در دنیایی که رقابت برای ساخت تراشه‌های هوش مصنوعی هر روز فشرده‌تر می‌شود، شرکت نوپای آمریکایی Positron AI با معرفی شتاب‌دهنده‌ای به نام اطلس (Atlas)، مدعی شده که در زمینه عملیات استنتاج (Inference) عملکردی بهتر از انویدیا H200 دارد، آن‌هم در حالی که تنها ۳۳ درصد انرژی کمتری مصرف می‌کند. این ادعا، اگر به‌طور عملی […]


avatar
نازنین طالب لو
10 مرداد 1404 | 4 دقیقه مطالعه
تراشه اطلس از Positron؛ چالشی تازه برای انویدیا H200 با قدرت بیشتر و مصرف کمتر

در دنیایی که رقابت برای ساخت تراشه‌های هوش مصنوعی هر روز فشرده‌تر می‌شود، شرکت نوپای آمریکایی Positron AI با معرفی شتاب‌دهنده‌ای به نام اطلس (Atlas)، مدعی شده که در زمینه عملیات استنتاج (Inference) عملکردی بهتر از انویدیا H200 دارد، آن‌هم در حالی که تنها ۳۳ درصد انرژی کمتری مصرف می‌کند. این ادعا، اگر به‌طور عملی تأیید شود، می‌تواند نقطه عطفی در صنعت پردازنده‌های مخصوص هوش مصنوعی به‌حساب آید.

بر اساس گزارشی از Tom’s Hardware، شرکت Positron که تنها از سال ۲۰۲۳ فعالیت رسمی خود را آغاز کرده، تمرکز خود را به‌طور خاص روی توسعه سخت‌افزارهای تخصصی برای عملیات استنتاج قرار داده است. برخلاف پردازنده‌های گرافیکی سنتی که برای انجام طیف متنوعی از وظایف مانند آموزش مدل‌های هوش مصنوعی و رندرینگ طراحی شده‌اند، تراشه‌های Positron از ابتدا با معماری‌ای سفارشی‌سازی‌شده برای استنتاج ساخته شده‌اند که هم بازده بالاتر دارند و هم مصرف انرژی بسیار بهینه‌تری.

معماری نوآورانه اطلس؛ پاسخ مستقیم به H200

تراشه اطلس، راهکار نسل اول Positron برای اجرای مدل‌های بزرگ هوش مصنوعی، به‌ویژه مدل‌های مبتنی بر ترنسفورمر است. این سامانه شامل هشت شتاب‌دهنده با نام Archer می‌شود و با هدف رقابت مستقیم با معماری Hopper شرکت انویدیا طراحی شده است. ادعا می‌شود که این سیستم، در عین کارایی بالاتر، تنها بخشی از انرژی مصرفی رقیبش را استفاده می‌کند و در برخی آزمایش‌ها موفق شده ۲۸۰ توکن در ثانیه را برای هر کاربر با استفاده از مدل LLaMA 3 8B در محدوده مصرف برق ۲۰۰۰ وات پردازش کند.

چنین عملکردی به‌ویژه برای شرکت‌هایی که به دنبال صرفه‌جویی در مصرف انرژی دیتاسنترها هستند، یک مزیت رقابتی واقعی خواهد بود. همچنین، با افزایش محبوبیت و کاربرد مدل‌های زبانی بزرگ (LLM) در حوزه‌های مختلف، تراشه‌هایی مثل اطلس که می‌توانند استنتاج سریع‌تری با مصرف کمتر ارائه دهند، آینده این صنعت را دگرگون خواهند کرد.

ورود شرکتی تازه‌تأسیس مانند Positron با چنین ادعای قدرتمندی به بازار، نشان می‌دهد که هنوز هم در حوزه طراحی سخت‌افزار هوش مصنوعی، جا برای نوآوری وجود دارد. اگر این شرکت واقعاً بتواند عملکرد ادعاشده را در مقیاس تجاری حفظ کند و قابلیت اطمینان و پایداری سیستم‌هایش را تضمین نماید، احتمالاً شاهد جابه‌جایی‌هایی در موازنه قدرت بین بازیگران اصلی این حوزه خواهیم بود. رقابتی که به نفع مصرف‌کننده نهایی خواهد بود و زمینه‌ساز توسعه سریع‌تر ابزارهای هوشمند آینده می‌شود.

اطلس در برابر DGX H200؛ شتاب‌دهنده‌ای کم‌مصرف با سه برابر بهره‌وری بیشتر؟

بر اساس اطلاعات منتشرشده از سوی شرکت Positron AI، سامانه اطلس (Atlas) که برای استنتاج مدل‌های هوش مصنوعی در مقیاس وسیع طراحی شده، عملکردی فراتر از انتظار ارائه می‌دهد. به‌عنوان مثال، در اجرای مدل LLaMA 3.1 با ۸ میلیارد پارامتر و استفاده از محاسبات BF16، اطلس قادر است با مصرف حدود ۲۰۰۰ وات انرژی، چیزی در حدود ۲۸۰ توکن در ثانیه برای هر کاربر تولید کند. این در حالی‌ است که سامانه قدرتمند DGX H200 انویدیا با پیکربندی ۸ کارت گرافیک و مصرف ۵۹۰۰ وات، تنها حدود ۱۸۰ توکن در ثانیه را ارائه می‌دهد.

گرچه این مقایسه توسط خود شرکت Positron انجام شده و هنوز توسط منابع مستقل تأیید نشده، اما در صورت صحت، تفاوت قابل‌توجهی در بهره‌وری انرژی و هزینه میان این دو سیستم مشهود است. طبق ادعای این شرکت، شتاب‌دهنده اطلس از نظر performance-per-watt و نسبت عملکرد به هزینه، حدود ۳ برابر کارایی بالاتر نسبت به پلتفرم DGX H200 دارد. اگر این ادعاها توسط نهادهای بی‌طرف تأیید شوند، می‌توان اطلس را تهدیدی واقعی برای سلطه سخت‌افزاری انویدیا در دیتاسنترها دانست.

از نظر ساخت، تراشه‌های اختصاصی اطلس از نوع ASIC بوده و با استفاده از فناوری‌های ساخت N4 یا N5 شرکت TSMC در کارخانه شماره ۲۱ واقع در ایالت آریزونا تولید می‌شوند. فرآیند مونتاژ کارت‌ها عمدتاً در داخل ایالات متحده انجام می‌گیرد، اما به‌دلیل استفاده از حافظه‌های HBM با ظرفیت ۳۲ گیگابایت و بهره‌گیری از فناوری‌های بسته‌بندی پیشرفته، احتمالاً بخشی از مونتاژ در تایوان صورت گرفته است.

اگرچه هنوز برای قضاوت قطعی درباره برتری اطلس زود است، اما آنچه مشخص است، ورود بازیگری جدید با رویکردی هدفمند و تخصصی به میدان رقابت است. Positron برخلاف بسیاری از شرکت‌ها که مسیر سنتی GPU را ادامه داده‌اند، مستقیماً سراغ طراحی سخت‌افزارهای بهینه‌سازی‌شده برای استنتاج رفته است. این تمرکز می‌تواند نه‌تنها مصرف انرژی دیتاسنترها را به شکل چشمگیری کاهش دهد، بلکه هزینه‌ تمام‌شده برای بسیاری از سازمان‌های مبتنی بر هوش مصنوعی را نیز کم کند. البته تا زمانی‌ که نتایج مستقل و شفاف‌تری منتشر نشود، این ادعاها در حد یک گمانه‌زنی جسورانه باقی خواهند ماند.

ثبت دیدگاه شما
دیدگاهی یافت نشد