آیا مدلهای هوش مصنوعی امروزی واقعاً تواناییهایی مشابه مغز انسان در یادآوری، تفکر، برنامهریزی و استدلال دارند؟ به اعتقاد «یان لیکان»، دانشمند ارشد هوش مصنوعی در متا، پاسخ فعلاً منفی است. او بر این باور است که با اتخاذ رویکردی جدید به نام «مدل جهانی»، احتمال دستیابی به این هدف در یک دهه یا بیشتر وجود دارد. به گزارش تککرانچ، برخی تحلیلگران حوزه هوش مصنوعی معتقدند که ما به هوش مصنوعی جامع (AGI) بسیار نزدیک شدهایم. با این حال، لیکان در یک سخنرانی اخیر در انجمن هادسون تأکید کرد که این خوشبینیها هنوز واقعیت ندارد. او میگوید: «ما به ماشینهایی نیاز داریم که دنیا را درک کنند؛ ماشینهایی که بتوانند اطلاعات را به خاطر بسپارند، شهود داشته باشند، عقل سلیم به کار ببرند و بتوانند در سطح انسانها استدلال و برنامهریزی کنند. علیرغم آنچه ممکن است شنیده باشید، سیستمهای هوش مصنوعی فعلی هیچیک از این قابلیتها را ندارند.»
او همچنین به معرفی ویژگی جدید «حافظه» در OpenAI اشاره کرد که به ChatGPT امکان میدهد مکالمات را «به خاطر بسپارد». جدیدترین مدل هوش مصنوعی این استارتاپ، با نام هوش مصنوعی o1، کلمه «تفکر» را در حین تولید خروجی به نمایش میگذارد و OpenAI ادعا میکند که این مدلها میتوانند «استدلال پیچیده» انجام دهند. نگاه یان لیکان به هوش مصنوعی، نشاندهنده واقعیتهای پیچیدهای است که در زمینه توسعه این فناوری وجود دارد. با وجود پیشرفتهای چشمگیر در هوش مصنوعی، هنوز فاصله زیادی تا دستیابی به سطحی از قابلیتها که به مغز انسان شباهت داشته باشد، داریم. نوآوریهایی مانند «حافظه» در ChatGPT و تلاش برای ایجاد مدلهای هوش مصنوعی جامع نشاندهنده عزم و اراده پژوهشگران است، اما مهم است که انتظارهای واقعبینانهای از این فناوریها داشته باشیم. مسیر پیش رو هنوز نیازمند تحقیقات و توسعههای بیشتری است تا بتوانیم به قابلیتهای واقعی و هوشمند نزدیکتر شویم.

فاصلهای بزرگ تا مدلهای هوش مصنوعی همسطح انسان
علت این فاصله کاملاً روشن است: مدلهای زبانی بزرگ بر اساس پیشبینی نشانههای بعدی (که معمولاً شامل چند حرف یا یک کلمه کوتاه میشود) عمل میکنند و مدلهای تصویری و ویدیویی فعلی نیز بر اساس پیشبینی پیکسلهای بعدی کار میکنند. به عبارتی دیگر، مدلهای زبانی بهعنوان پیشبینیکنندههای یکبعدی و مدلهای تصویر و ویدیو بهعنوان پیشبینیکنندههای دو بعدی عمل میکنند. این مدلها در پیشبینی در ابعاد مربوطه بسیار موفق شدهاند، اما درک دنیای سهبعدی برای آنها هنوز در دسترس نیست.
این مسأله باعث میشود که سیستمهای هوش مصنوعی مدرن نتوانند کارهای ساده انسانی را بهدرستی انجام دهند. «لکون» به این موضوع اشاره میکند که انسانها از سن ۱۰ سالگی میآموزند چگونه میز شام را مرتب کنند و در ۱۷ سالگی میتوانند رانندگی کنند، و هر دو مهارت را در مدت چند ساعت یاد میگیرند. اما حتی پیشرفتهترین سیستمهای هوش مصنوعی امروزی، که بر اساس هزاران یا میلیونها ساعت داده ساخته شدهاند، هنوز قادر به عملکرد قابل اعتماد در دنیای فیزیکی نیستند.