أول ذكاء اصطناعي يصنع ذكاء اصطناعي في التاريخ! GPT-5.3 يشارك في تطوير نفسه، والخيال العلمي يتحول إلى واقع

أصدرت OpenAI GPT-5.3-Codex، وهو أول نموذج “يشارك في إنشاء نفسه” لتصحيح كوده الخاص، وإدارة النشر، وتشخيص الاختبارات. وصف كارباثي التعديل بأنه “الأقرب إلى مشهد الانطلاق الذكاء الاصطناعي.”

بدأ الذكاء الاصطناعي في خلق تفردات تكنولوجية واختراقات في الذكاء الاصطناعي

تم إطلاق الحساب الرسمي ل OpenAI: GPT-5.3-Codex رسميا، وهو “الأول الذي يشارك في إنشاء نموذجك الخاص”. ماذا يعني ذلك؟ بعبارة أخرى، خلال عملية التطوير، ساعد هذا الذكاء الاصطناعي في تصحيح كود التدريب الخاص به، وإدارة عملية النشر الخاصة، وتشخيص نتائج اختباره الخاص. بمصطلحات بشرية، بدأ الذكاء الاصطناعي في خلق الذكاء الاصطناعي.

غرد أندريه كارباثي، الباحث السابق في OpenAI ومدير شركة تسلا للذكاء الاصطناعي، مباشرة بعد قراءته: “هذا أقرب شيء رأيته إلى مشهد ذكاء اصطناعي في عالم الخيال العلمي.” هذا التقييم من كبار الباحثين في الذكاء الاصطناعي ذو أهمية لأن كارباثي مر شخصيا بعدة مراحل رئيسية في تطوير الذكاء الاصطناعي، وحكمه مبني على فهم تقني عميق.

الذكاء الاصطناعي يكرر نفسه، وهذا ليس خطابا تسويقيا. وفقا للإفصاح الداخلي ل OpenAI، قام GPT-5.3-Codex بهذه الأمور أثناء عملية التطوير: تحليل الاختبارات التي فشلت في الإبلاغ عن سجلات التدريب، اقتراح إصلاحات لبرآت التدريب والملفات الشخصية، توليد وصفات نشر، وتلخيص وتقييم الشذوذات للمراجعة البشرية. ماذا يعني هذا؟ لم يعد الذكاء الاصطناعي مجرد أداة، بل بدأ يصبح جزءا من فريق التطوير، وهو النوع الذي يمكنه تحسين نفسه.

تدفع هذه القدرة على المشاركة في التطوير عبر التموضع التقليدي للذكاء الاصطناعي. في الماضي، كانت نماذج الذكاء الاصطناعي تصمم وتدربها وتنشر بالكامل من قبل البشر، وكان الذكاء الاصطناعي منتجا سلبيا. الآن، لعب GPT-5.3 دورا نشطا في ولادته، وعلى الرغم من أنه لا يزال تحت إشراف بشري، إلا أن هذا التحول في الدور له آثار بعيدة المدى. يلمح إلى احتمال: قد يتم تصميم وتحسين نماذج الذكاء الاصطناعي المستقبلية إلى حد كبير بواسطة الذكاء الاصطناعي نفسه، مع توفير البشر فقط للتوجيه والمراجعة النهائية.

المشاركة الذاتية في تطوير GPT-5.3

تحليل سجلات التدريب: يتم الإبلاغ تلقائيا عن الاختبارات الفاشلة لتحديد الشذوذات أثناء التدريب

خطة الإصلاح الموصى بها: اقتراح تحسينات على نصوص التدريب والملفات الشخصية

إنشاء وصفة النشر: أتمتة عملية النشر وتقليل العمليات اليدوية:

شذوذ تقييم ملخص: تنظيم نتائج التقييم المعقدة في تقارير يمكن للبشر:

تصف ورقة حديثة عن SEAL نشرتها MIT (arXiv:2506.10943) بنية ذكاء اصطناعي تتعلم باستمرار بعد النشر، وتتطور نفسها دون إعادة تدريب. ومن الجدير بالذكر أن بعض باحثي قوات SEAL انضموا الآن إلى OpenAI. هذا يعني أن الذكاء الاصطناعي تحول من “أداة ثابتة” إلى “نظام ديناميكي”، ولم يعد التعلم متوقفا عند النشر، وأصبحت حدود الاستنتاج والتدريب تذوب. قد يكون GPT-5.3 أول تطبيق تجاري لهذه البنية الجديدة.

77.3٪ سحقوا مجزرة كلود القياسية

في 5 فبراير، أصدرت كل من OpenAI وAnthropic جيلا جديدا من النماذج بفارق 20 دقيقة فقط. أولا، أصدرت Anthropic لعبة Claude Opus 4.6، ثم أطلقت OpenAI GPT-5.3-Codex. بما أن OpenAI تريد استخدام GPT-5.3-Codex لرصد نماذج الآخرين الجديدة، فلا بد أن لديها بعض القدرات. البيانات لا تكذب، فقد سجل GPT-5.3-Codex أرقاما قياسية جديدة في عدة معايير صناعية بمجرد إطلاقه.

يختبر Terminal-Bench 2.0 قدرات التشغيل للذكاء الاصطناعي في بيئة طرفية حقيقية، حيث يجمع الكود ويقوم بتدريب النماذج وتكوين الخوادم. حصلت GPT-5.3-Codex على 77.3٪، بينما حصلت GPT-5.2-Codex على 64.0٪ فقط، وClaude Opus 4.6 بنسبة 65.4٪. وهذا يمثل زيادة قدرها 13 نقطة مئوية بين الأجيال، وهو بالفعل قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي. تظهر المقارنة بين 77.3٪ و65.4٪ أن GPT-5.3 يحقق ميزة كبيرة في المهام الهندسية الواقعية.

SWE-Bench Pro هو معيار معياري مصمم خصيصا لاختبار قدرات هندسة البرمجيات الواقعية، ويغطي أربع لغات برمجة: بايثون، جافاسكريبت، جو، وروبي. حقق GPT-5.3-Codex نسبة 56.8٪، متجاوزا 56.4٪ من سابقه، GPT-5.2-Codex، واستمر في الحفاظ على مكانته الأولى في الصناعة. والأهم من ذلك، كشفت OpenAI أن GPT-5.3-Codex يستخدم أقل عدد من رموز الإخراج من أي نموذج عند وصوله إلى هذه الدرجة، مما يعني أنه ليس دقيقا فقط بل أيضا فعالا.

تختبر OSWorld-Verified قدرة الذكاء الاصطناعي على إكمال مهام الإنتاجية في بيئة سطح مكتب بصرية، من خلال تحرير جداول البيانات، وإنشاء العروض التقديمية، والعمل على المستندات، وأكثر من ذلك. حصل GPT-5.3-Codex على 64.7٪، مقارنة بالمتوسط البشري البالغ 72٪. وهذا يعني أنها اقتربت من أداء الأشخاص العاديين في مهام تشغيل الحاسوب، متدرجة تقريبا مقارنة بسابقتها. هذا الأداء شبه البشري يجعل الذكاء الاصطناعي قادرا حقا على العمل في المكاتب لأول مرة، وليس مجرد أداة مساعدة.

كلود يواجه فرق 100 ألف توكن ووكلاء

وما هو أكثر إثارة للانتباه هو أن Claude Opus 4.6 يدعم نافذة سياق ب 100 ألف رمز (بيتا) لأول مرة في نموذج Opus-level، والتي يمكنها معالجة قاعدة الشيفرة كاملة أو مئات الصفحات من المستندات دفعة واحدة، وأطلقت وظيفة Agent Teams، حيث يمكن لعدة وكلاء ذكاء اصطناعي التعاون في البرمجة والاختبار وكتابة المستندات في نفس الوقت.

عندما تصدر OpenAI وAnthropic نماذجهما الرئيسية في نفس اليوم وفي نفس اللحظة، لم تعد هذه المسابقة مجرد منافسة تقنية، بل معركة حول شكل المستقبل للذكاء الاصطناعي: مسار OpenAI “التطور الذاتي” أم مسار Anthropic “التعاون متعدد الوكلاء”؟ استراتيجية OpenAI هي جعل ذكاء اصطناعي واحد أكثر قوة وحتى تحسين نفسه. استراتيجية Anthropic هي السماح لعدة ذكاءات اصطناعية بالتعاون في مهام معقدة من خلال تقسيم العمل والتعاون.

سياق 100 ألف رمز هو اختراق تكنولوجي. وهذا يعادل حوالي 75 مليون كلمة إنجليزية أو 300 حرف صيني، وهو ما يكفي لاستيعاب كامل كود مشروع برمجي متوسط الحجم أو توثيق تقني كثيف. تسمح هذه القدرة لكلود ب “رؤية” المشروع بأكمله بدلا من فهم مجزأ. بالنسبة لتحليل العمارة وإعادة هيكلة المشاريع واسعة النطاق، فإن هذا المنظور العالمي أمر بالغ الأهمية.

تجلب فرق الوكلاء مفهوم التعاون إلى الذكاء الاصطناعي. يكتب وكيل واحد الكود، وآخر يختبر، وثالث يكتب التوثيق، ويمكنهم التواصل والتنسيق مع بعضهم البعض. هذا النمط يحاكي طريقة عمل فرق البرمجيات البشرية وقد يكون أكثر ملاءمة لبعض السيناريوهات من الذكاء الاصطناعي الفائق الواحد. ومع ذلك، فإن التعاون بين الوكلاء المتعدد يضيف أيضا تعقيدات جديدة: كيفية التنسيق، وكيفية تجنب النزاعات، وكيفية ضمان الاتساق.

كلا المسارين لهما مزايا وعيوب. مسار OpenAI في التطور الذاتي أكثر عدوانية، وإذا نجح، فقد يؤدي إلى تحسينات هائلة في القدرات، لكنه قد يخرج عن السيطرة أيضا. مسار Anthropic متعدد الوكلاء أكثر تحفظا، حيث يقلل من نقطة الخطر الفردية من خلال توزيع القدرات، لكن تكاليف التنسيق قد تحد من الكفاءة. مع بدء تطور الذكاء الاصطناعي في البرية، ستتحول أسئلة الحوكمة من “مدى ذكائها” إلى “كيف ندير نظاما يتغير باستمرار؟” وعندما تصدر شركتان رائدتان في مجال الذكاء الاصطناعي نماذج مبتكرة على التوالي خلال 20 دقيقة، فإن نافذة الوقت المتبقية للتفكير والاستعداد البشري تتقلص بسرعة يمكن رؤيتها بالعين المجردة.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Strategy 公司 STRC 本周交易量创新高,推算对应约 3.9 万枚 BTC 潜在购买规模

加密分析师Ragnar指出,Strategy公司的永续优先股STRC本周创下7.45亿美元的单日交易量,预计可能对应约3.9万枚比特币的购买规模。尽管市场潜力巨大,但当前加密市场结构尚未完全转向牛市,比特币与纳斯达克100指数相关性较高,可能面临市场回调风险。

GateNewsمنذ 1 س

昨日美国 SOL 现货 ETF 净流入 759.64 万美元,BSOL 贡献全部流入

3月14日消息,SoSoValue数据显示,3月13日美国SOL现货ETF单日净流入759.64万美元,唯一净流入产品为Bitwise Solana Staking ETF,历史总净流入达7.82亿美元。目前SOL现货ETF总资产净值为8.55亿美元。

GateNewsمنذ 1 س

一周精选丨告别“龙虾”狂欢,回归加密本源,Hyperliquid是本周最热项目

PANews编者按:PANews精选了一周的优质内容,帮助大家利用周末时间查漏补缺,点击标题即可阅读。 宏观视角 a16z:致加密创始人,企业不买最好的技术 区块链创始人如何向企业销售?本文揭示企业不买“最好”技术,而选择破坏最小的升级路径。结合真实案例,分享将区块链技术包装成企业可接受方案的关 马斯克最新访谈:AI已进入自我进化循环,人类正从“回路”中消失 马斯克在科技峰会透露,特斯拉擎天柱3人形机器人即将投产,AI已进入自我改进阶段。他预测未来经济将高速增长并转向通缩,商品服务产出远超货币供给,甚至预言“钱不再重要”。 对话Bitwise首席信息官:量子计算与AI威胁被夸大,

PANewsمنذ 1 س

美股收盘三大指数均下跌,加密概念股 UPXI 涨超 19%

3月14日,美股三大指数收跌,道指跌0.26%,标普500跌0.61%,纳指跌0.93%。加密概念股表现不一,UPXI涨超19.3%。同时,去中心化RWA交易平台msx.com上线数百种RWA代币,包括美股及ETF。

GateNewsمنذ 1 س

美股昨夜高开低收,加密货币概念股涨幅回吐

3月14日美股表现不佳,道指跌0.25%,标准普尔500指数跌0.6%,纳指跌0.93%。部分科技股下滑,Adobe跌7.5%,Meta跌3.8%。纳斯达克中国金龙指数上涨0.75%。加密货币概念股涨幅回吐。

GateNewsمنذ 2 س

布伦特原油期货连续第二日收于每桶 100 美元以上,创三年多来新高

Gate News 消息,3 月 14 日,布伦特原油(国际基准油价)期货价格连续第二个交易日收于每桶 100 美元以上,创下三年多来的最高水平。布伦特原油期货收于每桶 103.14 美元,美国 WTI 原油(美国基准油价)期货收于每桶 99 美元附近,为 2022 年 7 月以来的最高水平。与此同时,中东冲突持续蔓延,世界各国领导人正努力解决石油市场历史上最大的冲击。

GateNewsمنذ 2 س
تعليق
0/400
لا توجد تعليقات