در یک گردهمایی کم سابقه در ایالت کالیفرنیا، سی نفر از برجستهترین ریاضیدانان جهان شاهد نمایشی خیرهکننده از قدرت هوش مصنوعی بودند. در این رویداد دوروزه که بهشکل محرمانه برگزار شد، نسخه پیشرفتهای از مدل استدلالگر OpenAI با نام o4-mini در چالش با مسائل دشوار سطح دکترا قرار گرفت. نتیجه؟ شگفتی مطلق. این مدل توانست راهحلهایی ارائه دهد که حتی برای برخی از حرفهایترین ذهنهای ریاضی دنیا، چالشبرانگیز بود.
بر اساس گزارش Live Science، این رویداد بخشی از پروژهای بهنام FrontierMath بود؛ یک بنچمارک جدید که با نظارت سازمان غیرانتفاعی Epoch AI طراحی شد تا توانایی واقعی AI را در حل مسائل پیچیده، آن هم بدون اتکا به دادههای قبلاً منتشرشده، بسنجد. برای جلوگیری از هرگونه درز اطلاعات یا دسترسی غیرمجاز، تمام مکاتبات ریاضیدانان از طریق اپلیکیشن رمزنگاریشدهی سیگنال انجام شد.
این اتفاق تنها یک آزمایش علمی نبود، بلکه تلنگری جدی برای جامعه علمی، آموزشی و حتی صنعتی است. وقتی هوش مصنوعی میتواند با این سطح از دقت، به مسائل حلنشده پاسخ دهد، بهمعنای بازتعریف نقش انسان در فرآیند تحلیل و کشف است. البته این بهمعنای پایان کار انسان نیست، بلکه نویدبخش عصری جدید از همکاری انسان و ماشین برای فتح قلههایی است که تا پیشازاین تصور میشد تنها با ذهن انسانی قابل دستیابیاند. اکنون باید پرسید: قدم بعدی در مرز هوش و منطق چیست؟
وقتی هوش مصنوعی، ریاضیدانها را مات کرد؛ حل معمای نظریه اعداد در ۱۰ دقیقه!
در ابتدا همهچیز طبق انتظار پیش رفت؛ ریاضیدانان با طرح مسائل سنگین و پیچیده، قصد داشتند توان هوش مصنوعی را محک بزنند. برای هر سوالی که بات نمیتوانست پاسخش را بیابد، طراح آن ۷۵۰۰ دلار جایزه دریافت میکرد. اما ناگهان ورق برگشت.
پروفسور کن اونو، استاد برجسته دانشگاه ویرجینیا، که خود از داوران این رقابت بود، ابتدا از عملکرد مدل ناامید شده بود. اما ماجرا زمانی شگفتانگیز شد که او یک مسئله باز و حلنشده در حوزه «نظریه اعداد» را مطرح کرد. هوش مصنوعی o4-mini ابتدا در دو دقیقه تمام مقالات و منابع مرتبط را تحلیل کرد، سپس نسخهای سادهشده از مسئله را برای تمرین حل کرد و تنها ده دقیقه بعد، راهحلی دقیق، بینقص و جسورانه ارائه داد.
پایان پاسخش هم چیزی کم از نمایش هوش انسانی نداشت. ربات نوشت:
«نیازی به ارجاع نیست. این راهحل را خودم پیدا کردم»
مدل o4-mini برخلاف مدلهای زبانی معمولی که صرفاً متن تولید میکنند، یک مدل استدلالگر پیشرفته است. این مدل با آموزش بر دادههای تخصصی و بازخورد دقیق انسانی، بهجای تقلید اطلاعات، روند تفکر منطقی را شبیهسازی میکند و قدمبهقدم استدلال خود را نشان میدهد. همین توانایی است که باعث شده برخی از ریاضیدانان بنام، این مدلها را «نزدیک به نبوغ» توصیف کنند.
این اتفاق نهتنها نمایشی از پیشرفت هوش مصنوعی بود، بلکه یک هشدار جدی هم به حساب میآید. اگر AI میتواند در زمانی کوتاه مسائلی را حل کند که انسانها برایش سالها زمان صرف کردهاند، نقش ما در آینده پژوهش علمی چه خواهد بود؟ شاید زمان آن رسیده که بهجای ترس، به همکاری هوش انسانی و ماشینی فکر کنیم. چرا که آنچه پیشروست، نه رقابت، بلکه یک اتحاد بزرگ است برای رسیدن به افقهایی فراتر از تصور انسان.
