شرکت آنتروپیک از جدیدترین نسخه مدل پرچمدار خود، Claude Opus 4.5، رونمایی کرده است که به گفته این شرکت، بهترین مدل هوش مصنوعی جهان برای کدنویسی، اجرای ایجنتها و تعامل با کامپیوتر محسوب میشود. این نسخه، آخرین عضو از سری ۴.۵ آنتروپیک است و پس از عرضه Sonnet 4.5 در سپتامبر و Haiku 4.5 در اکتبر، بهصورت رسمی معرفی شد.
به گزارش TechCrunch، Claude Opus 4.5 در مجموعهای از بنچمارکها عملکرد بسیار پیشرفتهای از خود نشان میدهد. این بنچمارکها شامل SWE-Bench و Terminal-bench برای سنجش توان کدنویسی، tau2-bench و MCP Atlas برای ارزیابی استفاده از ابزارها و آزمونهای عمومی حل مسائل است. جالب اینکه این مدل نخستین هوش مصنوعی است که در SWE-Bench verified امتیاز بالاتر از ۸۰ درصد کسب میکند و نشان میدهد که توانایی بالایی در تولید کد دقیق و قابل اعتماد دارد.
Claude Opus 4.5 نشان میدهد که آنتروپیک مسیر خود را بهسمت هوش مصنوعی تخصصی و کاربردی برای برنامهنویسی و ایجنتها ادامه میدهد. امتیازات بالای این مدل در بنچمارکها، بهویژه SWE-Bench، نویدبخش ابزارهایی است که میتوانند واقعا جایگزین یا مکمل توسعهدهندگان شوند. اگر این مدل در پروژههای واقعی هم چنین عملکردی داشته باشد، میتواند استاندارد جدیدی برای هوش مصنوعیهای تخصصی ایجاد کند و فاصله میان ابزارهای عمومی و حرفهای را پر کند.
Claude Opus 4.5؛ هوش مصنوعی تازهنفس برای کروم، اکسل و کار با ایجنتها
آنتروپیک با معرفی Claude Opus 4.5 تمرکز ویژهای بر قابلیتهای تعامل با کامپیوتر و کار با صفحات گسترده داشته است. همزمان با رونمایی از این مدل، Claude for Chrome و Claude for Excel که پیشتر در مرحله آزمایشی بودند، اکنون در دسترس کاربران قرار گرفتهاند. افزونه کروم برای تمامی کاربران طرح Max و نسخه اکسل برای کاربران Max، Team و Enterprise ارائه میشود و تجربهای یکپارچه برای مدیریت وظایف و پردازش دادهها فراهم میکند.
Opus 4.5 با بهبودهای قابل توجه در سیستم حافظه برای مدیریت کانتکست طولانی عرضه شده است و امکان چت بیپایان را برای کاربران پولی فراهم میکند؛ به این معنا که زمانی که مدل به انتهای کانتکست برسد، گفتگو بدون وقفه ادامه مییابد و حافظه کانتکست به شکل هوشمند فشرده میشود. این ارتقاها بهویژه برای کاربردهای عاملمحور اهمیت دارد، جایی که Opus به عنوان عامل اصلی عمل کرده و مجموعهای از زیرباتها مجهز به Haiku را مدیریت میکند.
با این قابلیتها، Opus 4.5 در حالی وارد بازار میشود که باید در برابر مدلهای پیشرفته تازه منتشرشده مانند GPT 5.1 از OpenAI و جمینای ۳ گوگل رقابت کند.
Claude Opus 4.5 نهتنها در زمینه کدنویسی و پردازش دادهها، بلکه در مدیریت مکالمههای طولانی و عاملمحور یک گام بزرگ برداشته است. امکان چت بیپایان و بهبود حافظه کانتکست باعث میشود کاربران حرفهای و سازمانی بتوانند پروژهها و جریانهای کاری پیچیده را با آن مدیریت کنند. اگر این قابلیتها بهخوبی عملیاتی شوند، Opus 4.5 میتواند یکی از قویترین گزینهها برای هوش مصنوعی تخصصی در بازار باشد و رقابت با GPT 5.1 و جمینای ۳ را جذابتر کند.
