در دنیایی که رقابت برای ساخت تراشههای هوش مصنوعی هر روز فشردهتر میشود، شرکت نوپای آمریکایی Positron AI با معرفی شتابدهندهای به نام اطلس (Atlas)، مدعی شده که در زمینه عملیات استنتاج (Inference) عملکردی بهتر از انویدیا H200 دارد، آنهم در حالی که تنها ۳۳ درصد انرژی کمتری مصرف میکند. این ادعا، اگر بهطور عملی تأیید شود، میتواند نقطه عطفی در صنعت پردازندههای مخصوص هوش مصنوعی بهحساب آید.
بر اساس گزارشی از Tom’s Hardware، شرکت Positron که تنها از سال ۲۰۲۳ فعالیت رسمی خود را آغاز کرده، تمرکز خود را بهطور خاص روی توسعه سختافزارهای تخصصی برای عملیات استنتاج قرار داده است. برخلاف پردازندههای گرافیکی سنتی که برای انجام طیف متنوعی از وظایف مانند آموزش مدلهای هوش مصنوعی و رندرینگ طراحی شدهاند، تراشههای Positron از ابتدا با معماریای سفارشیسازیشده برای استنتاج ساخته شدهاند که هم بازده بالاتر دارند و هم مصرف انرژی بسیار بهینهتری.
معماری نوآورانه اطلس؛ پاسخ مستقیم به H200
تراشه اطلس، راهکار نسل اول Positron برای اجرای مدلهای بزرگ هوش مصنوعی، بهویژه مدلهای مبتنی بر ترنسفورمر است. این سامانه شامل هشت شتابدهنده با نام Archer میشود و با هدف رقابت مستقیم با معماری Hopper شرکت انویدیا طراحی شده است. ادعا میشود که این سیستم، در عین کارایی بالاتر، تنها بخشی از انرژی مصرفی رقیبش را استفاده میکند و در برخی آزمایشها موفق شده ۲۸۰ توکن در ثانیه را برای هر کاربر با استفاده از مدل LLaMA 3 8B در محدوده مصرف برق ۲۰۰۰ وات پردازش کند.
چنین عملکردی بهویژه برای شرکتهایی که به دنبال صرفهجویی در مصرف انرژی دیتاسنترها هستند، یک مزیت رقابتی واقعی خواهد بود. همچنین، با افزایش محبوبیت و کاربرد مدلهای زبانی بزرگ (LLM) در حوزههای مختلف، تراشههایی مثل اطلس که میتوانند استنتاج سریعتری با مصرف کمتر ارائه دهند، آینده این صنعت را دگرگون خواهند کرد.
ورود شرکتی تازهتأسیس مانند Positron با چنین ادعای قدرتمندی به بازار، نشان میدهد که هنوز هم در حوزه طراحی سختافزار هوش مصنوعی، جا برای نوآوری وجود دارد. اگر این شرکت واقعاً بتواند عملکرد ادعاشده را در مقیاس تجاری حفظ کند و قابلیت اطمینان و پایداری سیستمهایش را تضمین نماید، احتمالاً شاهد جابهجاییهایی در موازنه قدرت بین بازیگران اصلی این حوزه خواهیم بود. رقابتی که به نفع مصرفکننده نهایی خواهد بود و زمینهساز توسعه سریعتر ابزارهای هوشمند آینده میشود.
اطلس در برابر DGX H200؛ شتابدهندهای کممصرف با سه برابر بهرهوری بیشتر؟
بر اساس اطلاعات منتشرشده از سوی شرکت Positron AI، سامانه اطلس (Atlas) که برای استنتاج مدلهای هوش مصنوعی در مقیاس وسیع طراحی شده، عملکردی فراتر از انتظار ارائه میدهد. بهعنوان مثال، در اجرای مدل LLaMA 3.1 با ۸ میلیارد پارامتر و استفاده از محاسبات BF16، اطلس قادر است با مصرف حدود ۲۰۰۰ وات انرژی، چیزی در حدود ۲۸۰ توکن در ثانیه برای هر کاربر تولید کند. این در حالی است که سامانه قدرتمند DGX H200 انویدیا با پیکربندی ۸ کارت گرافیک و مصرف ۵۹۰۰ وات، تنها حدود ۱۸۰ توکن در ثانیه را ارائه میدهد.
گرچه این مقایسه توسط خود شرکت Positron انجام شده و هنوز توسط منابع مستقل تأیید نشده، اما در صورت صحت، تفاوت قابلتوجهی در بهرهوری انرژی و هزینه میان این دو سیستم مشهود است. طبق ادعای این شرکت، شتابدهنده اطلس از نظر performance-per-watt و نسبت عملکرد به هزینه، حدود ۳ برابر کارایی بالاتر نسبت به پلتفرم DGX H200 دارد. اگر این ادعاها توسط نهادهای بیطرف تأیید شوند، میتوان اطلس را تهدیدی واقعی برای سلطه سختافزاری انویدیا در دیتاسنترها دانست.
از نظر ساخت، تراشههای اختصاصی اطلس از نوع ASIC بوده و با استفاده از فناوریهای ساخت N4 یا N5 شرکت TSMC در کارخانه شماره ۲۱ واقع در ایالت آریزونا تولید میشوند. فرآیند مونتاژ کارتها عمدتاً در داخل ایالات متحده انجام میگیرد، اما بهدلیل استفاده از حافظههای HBM با ظرفیت ۳۲ گیگابایت و بهرهگیری از فناوریهای بستهبندی پیشرفته، احتمالاً بخشی از مونتاژ در تایوان صورت گرفته است.
اگرچه هنوز برای قضاوت قطعی درباره برتری اطلس زود است، اما آنچه مشخص است، ورود بازیگری جدید با رویکردی هدفمند و تخصصی به میدان رقابت است. Positron برخلاف بسیاری از شرکتها که مسیر سنتی GPU را ادامه دادهاند، مستقیماً سراغ طراحی سختافزارهای بهینهسازیشده برای استنتاج رفته است. این تمرکز میتواند نهتنها مصرف انرژی دیتاسنترها را به شکل چشمگیری کاهش دهد، بلکه هزینه تمامشده برای بسیاری از سازمانهای مبتنی بر هوش مصنوعی را نیز کم کند. البته تا زمانی که نتایج مستقل و شفافتری منتشر نشود، این ادعاها در حد یک گمانهزنی جسورانه باقی خواهند ماند.