آیا رونق هوش مصنوعی در حال کاهش است؟

آخرین گام رو به جلوی هوش مصنوعی، بیش از آنکه یک جهش بزرگ باشد، یک تغییر موقت و آزمایشی است. شرکت OpenAI، جدیدترین مدل هوش مصنوعی خود، GPT-5، را دو سال پس از عرضه GPT-4 منتشر کرده است. موفقیت این مدل، ChatGPT را به سمت سلطه جهانی سوق داده است. اما با وجود وعده‌های جهش مشابه در توانایی، به نظر می‌رسد GPT-5 پیشرفت کمی نسبت به سایر مدل‌های پیشرو هوش مصنوعی نشان می‌دهد و این نشان می‌دهد که صنعت ممکن است به رویکردی تازه برای ساخت سیستم‌های هوش مصنوعی هوشمندتر نیاز داشته باشد. در بیانیه‌های خود OpenAI، GPT-5 به عنوان یک «جهش قابل توجه در هوش» نسبت به مدل‌های قبلی این شرکت مورد ستایش قرار گرفته است که پیشرفت‌های آشکاری در برنامه‌نویسی، درک بصری، اطلاعات سلامت، ریاضیات و نوشتار را نشان می‌دهد. همچنین نوید توهمات کمتر را می‌دهد، زمانی که یک هوش مصنوعی اطلاعات نادرست را به عنوان درست ارائه می‌دهد. OpenAI در یک معیار داخلی که «عملکرد در کارهای دانشی پیچیده و از نظر اقتصادی ارزشمند» را اندازه‌گیری می‌کند، می‌گوید: «GPT-5 تقریباً در نیمی از موارد... در وظایفی که بیش از ۴۰ شغل از جمله حقوق، لجستیک، فروش و مهندسی را در بر می‌گیرد، «قابل مقایسه با متخصصان یا بهتر از آنهاست». با این حال، عملکرد GPT-5 در معیارهای عمومی به طور چشمگیری بهتر از مدل‌های «بسیاری از مردم امیدوار بودند که یک پیشرفت وجود داشته باشد، و این یک پیشرفت نیست» از سایر شرکت‌های هوش مصنوعی، مانند Claude شرکت Anthropic یا Gemini گوگل نیست. این مدل در GPT-4 بهبود یافته است، اما تفاوت در بسیاری از معیارها کمتر از جهش از GPT-3 به GPT-4 است.» بسیاری از مشتریان ChatGPT نیز تحت تأثیر قرار نگرفته‌اند و نمونه‌هایی از عدم پاسخگویی GPT-5 به سؤالات به ظاهر ساده، توجه گسترده‌ای را در رسانه‌های اجتماعی به خود جلب کرده است.

سم آلتمن از OpenAI می‌گوید: "استفاده از GPT-5 مانند صحبت کردن با یک متخصص در سطح دکترا است."

میرلا لاپاتا از دانشگاه ادینبورگ، انگلستان می‌گوید: "بسیاری از مردم امیدوار بودند که پیشرفتی حاصل شود، و این یک پیشرفت نیست."

جامع‌ترین معیارهای عملکرد GPT-5 از خود OpenAI گرفته شده است، زیرا فقط این شرکت به مدل دسترسی کامل دارد.

آنا راجرز از دانشگاه فناوری اطلاعات کپنهاگ در دانمارک می‌گوید: "جزئیات کمی در مورد معیار داخلی منتشر شده است. از این رو، این چیزی نیست که بتوان به عنوان یک ادعای علمی به طور جدی در مورد آن بحث کرد." در یک جلسه مطبوعاتی قبل از راه‌اندازی این مدل، سم آلتمن، مدیرعامل OpenAI، ادعا کرد: «GPT-5 اولین باری است که واقعاً حس صحبت کردن با یک متخصص در هر موضوعی، مانند یک متخصص در سطح دکترا، را به انسان می‌دهد.» اما راجرز می‌گوید این موضوع توسط معیارها پشتیبانی نمی‌شود. پیشرفت‌های ظاهراً متوسط ​​GPT-5 ممکن است نشانه‌ای از مشکلات گسترده‌تر برای توسعه‌دهندگان هوش مصنوعی باشد. تا همین اواخر، تصور می‌شد که چنین مدل‌های زبانی بزرگی (LLM) با داده‌های آموزشی بیشتر و قدرت رایانه‌ای بیشتر، توانمندتر می‌شوند. به نظر می‌رسد که این موضوع دیگر توسط نتایج جدیدترین مدل‌ها تأیید نمی‌شود و شرکت‌ها نتوانسته‌اند طرح‌های سیستم هوش مصنوعی بهتری نسبت به طرح‌هایی که ChatGPT را پشتیبانی کرده‌اند، پیدا کنند. لاپاتا با اشاره به فرآیند پیش‌آموزش مدل‌ها با حجم زیادی از داده‌ها و سپس انجام تنظیمات با فرآیندهای پس از آموزش می‌گوید: «در حال حاضر همه دستورالعمل یکسانی دارند و ما می‌دانیم که دستورالعمل چیست

با این حال، نیکوس آلتراس از دانشگاه شفیلد انگلستان می‌گوید: «رقابت شدید» با این حال، دشوار است که بگوییم LLMها چقدر به رکود نزدیک هستند، زیرا دقیقاً نمی‌دانیم مدل‌هایی مانند GPT-5 چگونه طراحی می‌شوند.

OpenAI روی روش‌های دیگری برای کارآمدتر کردن محصول خود، مانند سیستم مسیریابی جدید GPT-5، کار کرده است. برخلاف نمونه‌های قبلی ChatGPT، که در آن افراد می‌توانستند انتخاب کنند که از کدام مدل هوش مصنوعی استفاده کنند، GPT-5 اکنون درخواست‌ها را اسکن کرده و آنها را به مدلی هدایت می‌کند که از مقدار مناسبی از قدرت محاسباتی استفاده خواهد کرد. لاپاتا می‌گوید این رویکرد ممکن است به طور گسترده‌تری مورد استفاده قرار گیرد.

او می‌گوید: «مدل‌های استدلال از محاسبات زیادی استفاده می‌کنند و این به زمان و هزینه نیاز دارد. اگر بتوانید با یک مدل کوچک‌تر به آن پاسخ دهید، در آینده شاهد موارد بیشتری از آن خواهیم بود

اما این اقدام برخی از مشتریان ChatGPT را خشمگین کرده و باعث شده است که آلتمن بگوید این شرکت به دنبال بهبود این فرآیند است.

نشانه‌های مثبت بیشتری برای آینده هوش مصنوعی در یک مدل جداگانه OpenAI وجود دارد که در ماه گذشته در مسابقات کدنویسی نخبگان و ریاضیات مدال طلا کسب کرده است، کاری که مدل‌های برتر هوش مصنوعی یک سال پیش نمی‌توانستند انجام دهند. در حالی که جزئیات نحوه کار مدل‌ها دوباره کم است، کارمندان OpenAI گفته‌اند که موفقیت آن نشان می‌دهد که سیستم قابلیت‌های استدلال عمومی‌تری دارد. آلتراس می‌گوید این رقابت‌ها برای آزمایش مدل‌ها روی داده‌هایی که در طول آموزش خود ندیده‌اند مفید هستند، اما هنوز آزمون‌های محدودی از هوش هستند. لاپاتا می‌گوید افزایش عملکرد یک مدل در یک زمینه ممکن است آن را در زمینه‌های دیگر بدتر کند، که پیگیری آن می‌تواند دشوار باشد. یکی از زمینه‌هایی که GPT-5 در آن به طور قابل توجهی بهبود یافته است، قیمت آن است - به عنوان مثال، بهترین مدل Claude شرکت Anthropic، در زمان نگارش این مطلب، حدود 10 برابر بیشتر برای پردازش همان تعداد درخواست هزینه دارد. اما اگر هزینه‌های هنگفتی که آنها برای ساخت و اداره مراکز داده جدید متحمل شده‌اند. رقابت بین مدل‌های هوش مصنوعی شدید است، به خصوص با این انتظار که اولین شرکتی که جلو بیفتد، بیشتر سهم بازار را به دست خواهد آورد. لاپاتا می‌گوید: «همه این شرکت‌های بزرگ، سعی می‌کنند تنها برنده باشند و این کار سختی است.» درآمد OpenAI این هزینه‌ها را پوشش نداده، این می‌تواند مشکلات خاص خود را ایجاد کند. 

Comments