صنعت هوش مصنوعی در ۲۴ ساعت گذشته شاهد دو تحول مهم بود. از یک سو، اوپنایآی نسخه کامل مدل امنیتی GPT-5.5-Cyber را با کسب امتیاز ۸۵.۶٪ در بنچمارک CyberGym منتشر کرد که برای سازمانهای امنیتی و دولتها در دسترس قرار گرفته است. از سوی دیگر، با وجود وعده گوگل برای انتشار جمینی ۳.۵ پرو در ژوئن، این مدل هنوز بهصورت عمومی در دسترس نیست و گزارشها نشان میدهد که در حوزه استدلال پیشرفته و کدنویسی از رقبای خود عقبتر است.
به گزارش آی سی تی نیوز، صنعت هوش مصنوعی در روزهای اخیر شاهد دو تحول مهم در حوزه رقابت مدلهای بزرگ زبانی بوده است.
بخش اول: GPT-5.5-Cyber؛ پاسخ امنیتی اوپنایآی به آنتروپیک
اوپنایآی روز یکشنبه (۲۲ ژوئن) نسخه کامل مدل تخصصی امنیت سایبری خود با نام GPT-5.5-Cyber را منتشر کرد. این مدل که در چارچوب برنامه Daybreak عرضه شده، با کسب امتیاز ۸۵.۶٪ در بنچمارک CyberGym، رکورد جدیدی را ثبت کرده است .
برتری نسبت به رقبا:
GPT-5.5-Cyber امتیاز ۸۵.۶٪ در CyberGym
Anthropic Mythos 5 امتیاز ۸۳.۸٪ در CyberGym
GPT-5.5 استاندارد امتیاز ۸۱.۸٪ در CyberGym
امتیاز CyberGym میزان توانایی یک مدل هوش مصنوعی در بازتولید آسیبپذیریهای شناختهشده در نرمافزارها را اندازهگیری میکند . این مدل همچنین در بنچمارک ExploitGym امتیاز ۳۹.۵٪ (در مقابل ۲۵.۹۵٪ GPT-5.5) و در SEC-bench Pro امتیاز ۶۹.۸٪ (در مقابل ۶۳.۱٪ GPT-5.5) کسب کرده است .
دسترسی محدود؛ ویژه سازمانهای امنیتی
برخلاف مدلهای عمومی اوپنایآی، GPT-5.5-Cyber از طریق برنامه Trusted Access for Cyber در اختیار سازمانهای امنیتی تأییدشده قرار میگیرد . این مدل میتواند در کدبیسهای بزرگ، مسیرهای حملات را ردیابی کرده، آسیبپذیریها را اعتبارسنجی و وصلههای هدفمند تولید کند .
همکاری با دولت آمریکا
اوپنایآی پیش از انتشار این مدل، با نهادهای دولتی از جمله مرکز استانداردها و نوآوری هوش مصنوعی (CAISI) و دفتر مدیر ملی سایبری (ONCD) هماهنگی کرده است . همچنین ۲۸ شرکت امنیتی از جمله CrowdStrike، Cisco و Cloudflare به برنامه همکاری این شرکت پیوستهاند .
بخش دوم: جمینی ۳.۵ پرو؛ وعدهای که همچنان محقق نشده
در سوی دیگر، گوگل همچنان با چالش تأخیر در انتشار مدل پرچمدار خود روبرو است. ساندار پیچای، مدیرعامل گوگل، در رویداد I/O ۲۰۲۶ وعده داده بود که Gemini 3.5 Pro تا ژوئن ۲۰۲۶ در دسترس عموم قرار خواهد گرفت . با این حال، با گذشت ۲۴ روز از ماه ژوئن و تنها ۶ روز تا پایان ماه، این مدل همچنان بهصورت عمومی در دسترس نیست .
مشخصات فنی تأییدشده:
پنجره زمینه ۲ میلیون توکن
حالت استدلال Deep Think (اختصاصی مشترکان سطح Ultra با قیمت ۲۵۰ دلار در ماه)
قیمت تخمینی: ۱۵ دلار به ازای هر میلیون توکن ورودی و ۶۰ دلار به ازای هر میلیون توکن خروجی
نگرانی از عملکرد؛ عقبماندگی در استدلال و کدنویسی
گزارشهای اولیه از نسخه پیشنمایش محدود Gemini 3.5 Pro در Vertex AI نشان میدهد که این مدل در حوزه استدلال پیشرفته، پردازش دوسویه کد و اجرای وظایف بلندمدت از رقبای خود عقبتر است . این در حالی است که Gemini 3.5 Flash که پیشتر منتشر شده بود، در حوزه کدنویسی و وظایف عاملمحور بهبود داشته اما در استدلال سخت، عملکرد ضعیفتری نسبت به Gemini 3.1 Pro داشته است .
تحلیل ICTNews؛ شکاف در حال افزایش؟
این دو خبر همزمان نشاندهنده تغییرات مهم در رقابت مدلهای هوش مصنوعی است:
۱. اوپنایآی با سرعت جلو میرود: انتشار GPT-5.5-Cyber نشان میدهد که اوپنایآی نهتنها در مدلهای عمومی، بلکه در حوزههای تخصصی مانند امنیت سایبری نیز پیشرو است. این مدل با کسب امتیاز بالاتر از Mythos 5 آنتروپیک و GPT-5.5 استاندارد، جایگاه اوپنایآی را تثبیت کرده است .
۲. گوگل همچنان در پیچ تأخیر: خروج دو محقق برتر گوگل (جان جمپر به آنتروپیک و نوم شازیر به اوپنایآی) و تأخیر در انتشار Gemini 3.5 Pro، نگرانیهایی درباره توانایی گوگل در رقابت با اوپنایآی و آنتروپیک ایجاد کرده است. با ۶ روز فرصت، گوگل باید هرچه سریعتر این مدل را منتشر کند و عملکرد آن را در عمل به اثبات برساند.