الذكاء الاصطناعي أتقن اللغة. العالم المادي هو التالي

القفزة الكبرى التالية في الذكاء الاصطناعي لن تأتي من نماذج اللغة الأفضل. ستأتي من آلات تفهم كيف يعمل العالم المادي وكيفية السيطرة عليه.

فيديو موصى به


لقد قضيت سنوات أفكر في هذا الأمر، أولاً كعالم مناعية في أكسفورد، أدرس كيف تتعلم الشبكات المناعية من خلال التغذية الراجعة بدلاً من التعليمات، ثم كمستثمر يقود أكبر استثمار بذري لشركة خوسلا فينتشرز منذ OpenAI، في مختبر نمذجة العالم المسمى General Intuition.

القيود الأساسية على الذكاء الاصطناعي المجسد ليست في الحوسبة أو الهيكلية. إنها نوع معين من البيانات بالكاد موجود.

إطلاق العنان للجنّي

في وقت سابق من هذا العام، أطلقت Google مشروع Genie وأدت إلى هبوط سوق الألعاب بالكامل. قرأ السوق ذلك كتهديد لـ Unity و TakeTwo Interactive و Roblox، وكل خط إنتاج المحتوى—الذكاء الاصطناعي يهاجم مطوري الألعاب. لكن تقليل الأمر إلى اضطراب في الألعاب يشبه مشاهدة عرض أول iPhone واستنتاج أن Apple كانت تستهدف Nokia. اللعب الحقيقي هو امتلاك كل عبء عمل مكاني على الكوكب.

ما كشف عن يد Google ليس ما يفعله Genie بشكل جيد، بل ما يتنازل عنه: بيئات تدوم فقط بضع دقائق، تأخير ملحوظ، فيزياء تتصرف بشكل غريب. في الوقت الحالي، هذه قيود مقبولة عندما لا يكون الهدف الحقيقي ترفيهيًا. أخبرتنا Google صراحة أن Genie 3 هو “خطوة رئيسية على طريق الوصول إلى الذكاء الاصطناعي العام”، وهو بنية تحتية لتدريب SIMA، وكيلهم العام الذي يحتاج إلى بيئات متنوعة لا نهاية لها ليتعلم التنقل، والتعامل مع الأجسام، والفيزياء الواقعية. إن إنشاء أشياء أثناء الجلسة وتغيير الظروف البيئية على الفور ليس ميزة في الألعاب. إنه مولد منهج للتعلم المعزز.

ما أنشأته Google هو مصنع بيئات، نظام يقضي على شهور من البرمجة اليدوية التقليدية لإنشاء محاكيات تدريبية في ثوانٍ من النصوص التوجيهية.

التجاوز عن الشاشات الزجاجية

لفهم لماذا يهم هذا التمييز، قم بالتكبير. على الرغم من الاضطرابات التي أحدثها الثورة الرقمية، إلا أن القليل جدًا تغير في كيفية تفاعلنا المادي مع الواقع. كانت القفزة من الحوسبة المكتبية المبكرة إلى الهاتف الذكي وهندسة المحولات هائلة من حيث تدفق المعلومات. لكننا لا نزال نلمس الشاشات الزجاجية بشكل أساسي.

فكر في السنجاب خارج نافذتك، يقفز من فرع إلى آخر، ويعدل أثناء الطيران من أجل الريح والمرونة. يمتلك نموذجًا داخليًا متطورًا جدًا للفيزياء: الجاذبية، الزخم، الاحتكاك، ويمكنه تخطيط تسلسلات معقدة من الأفعال. ومع ذلك، لا يملك لغة. هو ببساطة يعرف، بطريقة كانت موجودة قبل أن يمكن الوصف.

لقد تجاهل الذكاء الاصطناعي هذا النوع من المعرفة تقريبًا. نماذج اللغة الكبيرة اليوم يمكنها كتابة سوناتات وتصحيح الشفرات. لكن اسألها أن تطوي منشفة وستكتشف الفجوة بين معرفة العالم ومعرفة كيفية التصرف فيه. اللغة مجرد ضغط لتجربة الإنسان. النص يلتقط فقط شريحة رقيقة مما نعرفه.

نماذج العالم، الشبكات العصبية المدربة على فهم وتوقع الواقع الفيزيائي، تعد بتغيير تلك المعادلة. يان ليكونن يفهم هذا، وأعلن أن “نماذج اللغة الكبيرة في الأساس طريق مسدود عندما يتعلق الأمر بالذكاء الفائق” قبل أن يترك Meta ليطلق شركته الناشئة لنمذجة العالم. أطلقت مختبرات World Labs بقيادة في-في لي Marble، الذي يولد بيئات ثلاثية الأبعاد. كلاهما يدرك أن الذكاء المكاني هو الجبهة التالية للذكاء الاصطناعي.

لكن لا أحد منهما حلّ القيد الأساسي: ليس لديهم البيانات لبناء وكلاء.

تدريب الوكيل يتطلب بيانات مشروطة بالإجراء. ليس فقط كيف بدا العالم، بل ما فعله شخص ما وما حدث بعد ذلك: الملاحظة، القرار، الفعل، العاقبة. الحلقة الكاملة. التحول إلى وكلاء يتطلب ملايين الساعات من اتخاذ القرارات البشرية الملتقطة من المصدر، والمتوافقة مع تغييرات الحالة الناتجة، والمختارة ذاتيًا للحالات الحدية.

الأيدي كعنق زجاجة نهائي

قد تكون الألعاب الجواب غير المتوقع. فهي توفر سجلات كاملة لوكالة الإنسان، كل إدخال مسجل ومرقم، في بيئات تلتقط الفيزياء واتخاذ القرار تحت عدم اليقين. ملايين الساعات من الحكم البشري، رقمية بالفعل.

أعمق قيمة ليست الفيزياء. إنها الحدس البشري. محرك الفيزياء يحاكي كيف يتحرك الطائرة بدون طيار؛ لا يمكنه نمذجة كيف يتفاعل المشغل الماهر عندما يفاجأ. في الجراحة، هو الإحساس بكيفية استجابة الأنسجة للمشرط. التدريب على اتخاذ القرارات البشرية يلتقط خبرة لا يمكن وصفها بالكلمات، فقط تُظهر وتُشعر.

احصل على هذا بشكل صحيح، وتردداته تتردد مع ما فعله البرمجيات بالمعلومات.

عندما يمكن لآلة أن تتعلم مهمة التلاعب من ساعات من العرض بدلاً من شهور من البرمجة، تتغير اقتصاديات التصنيع. يصبح الإنتاج بكميات صغيرة ممكنًا. تكلف السلع المخصصة ما تكلفه السلع الجماعية اليوم. يتم نشر معرفة كهربائي ماهر في ألف مدينة في آن واحد. حكم الجراح الأفضل يتوسع ليشمل المستشفيات الريفية التي لا تتوفر لها الآن. لم يكن القيد أبدًا في المشارط، بل في الأيدي.

الزراعة، اللوجستيات، رعاية المسنين. كل مجال يفتقر فيه المهارة المادية يصبح مرشحًا للتحول. الخيط المشترك: الخبرة المقفلة في الأجسام الفردية تصبح قابلة للنقل.

جعلت الثورة الرقمية المعلومات مجانية. ثورة نماذج العالم ستجعل القدرة مجانية. لا أستطيع أن أتصور رهانًا أكثر أهمية لأقوم به.

الآراء المعبر عنها في مقالات Fortune.com هي آراء مؤلفيها فقط ولا تعكس بالضرورة آراء ومعتقدات Fortune.

انضم إلينا في قمة ابتكار مكان العمل من Fortune في 19-20 مايو 2026 في أتلانتا. عصر جديد من ابتكار مكان العمل هنا—والكتاب القديم يُعاد كتابته. في هذا الحدث الحصري والنشيط، يجتمع قادة أكثر ابتكارًا في العالم لاستكشاف كيف يتلاقى الذكاء الاصطناعي والبشرية والاستراتيجية لإعادة تعريف مستقبل العمل مرة أخرى. سجل الآن.

AGI2.07%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.4Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.4Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:1
    0.00%
  • تثبيت