امتیاز کم هوش مصنوعی «اوپن‌ای‌آی» در یک آزمایش، سؤال‌برانگیز شد

اردیبهشت ۱, ۱۴۰۴

پست های مرتبط

سیاست‌گذاران کارنامه سیاست‌های گذشته را دوباره ارزیابی کنند؛اینترنت در انتظار یک تصمیم ملی

تیر ۳۱, ۱۴۰۵

معاون وزیر ارتباطات: رشد اینترنت متناسب با تقاضا نبوده است

تیر ۳۰, ۱۴۰۵

عارف: اجرای طرح‌های اولویت‌دار فناوری با جدیت پیگیری شود

تیر ۳۰, ۱۴۰۵

آغاز همکاری راهبردی پژوهشگاه ارتباطات و ساترا برای توسعه حکمرانی هوشمند فضای رسانه‌ای

تیر ۳۰, ۱۴۰۵

در پژوهشگاه فضای مجازی؛کتاب «بررسی فقهی بازنمایی معصومین در بازی‌های رایانه‌ای و متاورس» رونمایی شد

تیر ۳۰, ۱۴۰۵

وزیر ارتباطات خبر داد:رتبه دوم استان اردبیل در رشد پوشش فیبر نوری

تیر ۲۹, ۱۴۰۵

وزیر ارتباطات: ۱۰۰ نقطه در مسیر نجف به کربلا به اینترنت رایگان مجهز می‌شود

تیر ۲۹, ۱۴۰۵

دکتر آقامیری در نشست دیاسپورای فناوری: راهکار جلوگیری از مهاجرت نخبگان «توسعه پروژه های بزرگ مقیاس» است

تیر ۲۹, ۱۴۰۵

مدل هوش مصنوعی o3 «اوپن‌ای‌آی» در یک آزمایش، کمتر از آنچه شرکت در ابتدا گفته بود، امتیاز گرفت.

به گزارش ای سی تی نیوز، اختلاف بین نتایج یک آزمایش جدید با اطلاعات اولیه درباره مدل هوش مصنوعی «o3» شرکت «اوپن‌ای‌آی»(OpenAI)، پرسش‌هایی را درباره شفافیت و شیوه‌های آزمایش مدل هوش مصنوعی این شرکت ایجاد می‌کند.

وقتی اوپن‌ای‌آی در ماه دسامبر از o3 رونمایی کرد، مدعی شد این مدل می‌تواند به بیش از یک چهارم پرسش‌های «FrontierMath» که مجموعه چالش‌برانگیزی از مسائل ریاضی است، پاسخ دهد. این امتیاز، رقابت را از بین برد؛ زیرا بهترین مدل بعدی تنها توانست به حدود دو درصد از مسائل FrontierMath به درستی پاسخ دهد.

«مارک چن»(Mark Chen)، مدیر ارشد تحقیقات اوپن‌ای‌آی در جریان یک پخش زنده گفت: امروز همه مدل‌ها کمتر از دو درصد امتیاز را در FrontierMath دارند. ما شاهد هستیم که با o3 می‌توانیم به امتیاز بیش از ۲۵ درصد برسیم.

همان طور که مشخص شد، این احتمالا امتیاز بالاتری بود که توسط یک نسخه از o3 با محاسبات بیشتر نسبت به مدل عرضه‌شده اوپن‌ای‌آی در هفته گذشته به دست آمد.

مؤسسه تحقیقاتی «Epoch AI» مسئول FrontierMath، نتایج آزمایش مستقل خود درباره o3 را در روز جمعه منتشر کرد. این مؤسسه دریافت o3 حدود ۱۰ درصد امتیاز کسب کرده که بسیار کمتر از بالاترین امتیاز ادعاشده توسط اوپن‌ای‌آی است.

این بدان معنا نیست که اوپن‌ای‌آی دروغ گفته است. نتایج آزمایشی که این شرکت در ماه دسامبر منتشر کرد، یک امتیاز پایین‌تر را نشان می‌دهد که با امتیاز مشاهده‌شده در آزمایش Epoch AI مطابقت دارد. همچنین، Epoch خاطرنشان کرد که تنظیمات آزمایشی آن احتمالا با اوپن‌ای‌آی تفاوت دارد و از نسخه به‌روزرسانی‌شده FrontierMath برای ارزیابی‌های خود استفاده کرده است.

Epoch نوشت: تفاوت بین نتایج ما و اوپن‌ای‌آی ممکن است به دلیل ارزیابی این شرکت با چارچوب داخلی قوی‌تر و استفاده از زمان آزمایش بیشتر یا به این دلیل باشد که این نتایج در زیرمجموعه دیگری از FrontierMath به دست آمده‌اند.

برچسب ها: اوپن‌ای‌آی مدل هوش مصنوعی o3