لقد ساعدت Google مجاناً في تدريب الذكاء الاصطناعي لمدة 15 سنة، لكنك كنت طوال الوقت في الظلام

robot
إنشاء الملخص قيد التقدم

标题:لقد كنت تدرب ذكاء جوجل الاصطناعي لمدة 15 عامًا، ولم تكن تعلم

المؤلف: شربل

المصدر:

نشر: مارسي فاينانس

يتم استغلال حوالي 500 ألف ساعة من العمل البشري يوميًا مجانًا من قبل جوجل. والأشخاص الذين يساهمون في ذلك، هم فقط يريدون تسجيل الدخول إلى حساباتهم البنكية.

reCAPTCHA هو أنجح عمليات جمع البيانات الخفية في تاريخ الإنترنت. في ذروته، كان يتم إكمال 200 مليون عملية تحقق يوميًا. لكن قليلين يدركون ما يعنيه كل نقرة وراءها.

شركة جوجل للسيارات ذاتية القيادة Waymo، تبلغ قيمتها الآن 45 مليار دولار. ومعظم بيانات التدريب الأساسية لها، هي تلك التي تقدمها أنت مجانًا عند تصفحك لمواقع الويب المختلفة.

إليك القصة كاملة:

البداية: فكرة ذكية

في عام 2000، كانت روبوتات البريد المزعج تدمر الإنترنت. المنتديات كانت مليئة بالرسائل العشوائية، وصناديق البريد ممتلئة، والمواقع كانت بحاجة ماسة إلى طريقة لتمييز البشر عن الآلات.

حلّها أستاذ جامعة كارنيجي ميلون لويس فون آنه. اخترع اختبار الكابتشا (CAPTCHA): نص مشوه لا يستطيع قراءته إلا الإنسان، بينما لا يستطيع الروبوتات تجاوزه.

لكن فون آنه رأى أكثر من ذلك. ملايين الأشخاص قضوا وقتًا وجهدًا في هذه التحديات. فماذا لو كان يمكن استغلال هذا الجهد في إنجاز مهمتين في آن واحد؟

في عام 2007، أطلق reCAPTCHA. كانت فكرته الذكية أن لا تعرض نصوصًا عشوائية، بل تظهر كلمتين: واحد معروف للنظام، والآخر غير معروف بعد، وهو عبارة عن صفحات كتب حقيقية لم يتم التعرف عليها بعد بواسطة الحاسوب. ومساعدتك في الإجابة يساعد في رقمنة هذه الكتب.

هذه الكتب تأتي من أرشيف صحيفة نيويورك تايمز وكتب جوجل، وتصل إلى 130 مليون كتاب.

كنت تظن أنك فقط تسجل الدخول إلى موقع عادي، لكنك في الحقيقة تساهم في بناء أكبر مكتبة رقمية باستخدام تقنية التعرف الضوئي على الأحرف (OCR).

في عام 2009، استحوذت جوجل رسميًا على reCAPTCHA.

ثم غيرت جوجل الأسلوب

انتهى عصر النص المشوه حوالي عام 2012.

واجهت جوجل تحديًا جديدًا: أن سياراتها ذاتية القيادة تلتقط صورًا لكل شارع في العالم، لكن الصور هي بيانات خام. ولتمكين الذكاء الاصطناعي من العمل، يحتاج إلى فهم ما يراه: لافتات الطرق، خطوط المشاة، إشارات المرور، واجهات المحلات.

لذا، أعادت جوجل تصميم reCAPTCHA إلى الإصدار 2.0. لم تعد تظهر نصوصًا مشوهة، بل شبكة من الصور. «انقر على جميع المربعات التي تحتوي على إشارة مرور»، «اختر كل خطوط المشاة»، «حدد الواجهات التجارية».

هذه الصور تأتي مباشرة من خدمة خرائط جوجل. ونقراتك تعتبر تصنيفات.

كل اختيار منك يخبر نموذج الرؤية الحاسوبية الخاص بجوجل: أن هذه البكسلات تمثل إشارة مرور، وأن هذا الشكل هو خط مشاة. أنت لا تختبر نفسك، أنت تبني مجموعة بيانات.

حجم يفوق الخيال

في ذروته، كانت تُحل 200 مليون عملية reCAPTCHA يوميًا. كل تحدٍ يستغرق 10 ثوانٍ، مما يعني أن العمل البشري الناتج يوميًا هو 2 مليار ثانية، أي حوالي 500 ألف ساعة.

تكلفة تصنيف البيانات المدفوعة تتراوح بين 10 و50 دولارًا للساعة. وبأدنى تقدير، فإن القيمة المهدرة يوميًا من العمل المجاني تصل إلى 5 ملايين دولار.

وليس reCAPTCHA مقتصرًا على تطبيق معين. إنه موجود في كل بنك، وكل بوابة حكومية، وكل موقع تجارة إلكترونية. لا خيار لديك: تريد تسجيل الدخول؟ عليك أولًا تصنيف البيانات. جوجل لم تسأل رأيك أبدًا، ولم تدفع لك سنتًا، ولم تخبرك حتى عن ذلك.

ماذا ينتج عن كل ذلك؟

هذه البيانات تُستخدم مباشرة في منتجين:

  • خرائط جوجل: أداة الملاحة الأكثر استخدامًا عالميًا. قدرته على التعرف على اللافتات، والمتاجر، والجغرافيا الحضرية، تعود جزئيًا إلى مليارات التصنيفات التي قام بها المستخدمون عند تسجيل الدخول.

  • Waymo: مشروع السيارات ذاتية القيادة من جوجل. من أجل التنقل الآمن، تحتاج السيارات إلى التعرف بدقة على آلاف الأنماط البصرية.

البيانات الحقيقية التي تدرب هذه الأنظمة، هي تلك التي قام مئات الآلاف من الأشخاص بتصنيفها دون علمهم عبر reCAPTCHA. في عام 2024، أكملت Waymo أكثر من 4 ملايين رحلة مدفوعة، وتقدر قيمتها بـ 45 مليار دولار. والأساس هو تلك الجهود غير المدفوعة من «مواطنين الإنترنت» الذين فقط أرادوا التحقق من بريدهم.

لماذا لا يمكن لأي شركة تكرار هذا النموذج؟

تصنيف البيانات مكلف جدًا. وجود شركات مثل Scale AI و Appen و Labelbox يهدف إلى حل هذه المشكلة، حيث توظف مئات الآلاف من العمال، وأحيانًا بأجور تقل عن دولار في الساعة.

أما حل جوجل، فهو مختلف تمامًا: جعل التصنيف إلزاميًا. بدون دفع، بدون موافقة، كـ «تذكرة» لدخول كل ركن من الإنترنت. والنتيجة: مليارات الصور المصنفة، وتغطية عالمية، وبيئة عمل على مدار الساعة، وكل مدينة في العالم. لا يمكن لأي شركة تصنيف أن توازي ذلك. الإنترنت نفسه هو المصنع، وكل مستخدم هو عامل غير رسمي.

لا تزال تشارك حتى الآن

في عام 2018، أطلقت جوجل reCAPTCHA v3، التي لا تعرض تحديات على الإطلاق. تراقب حركات الماوس، وسرعة التمرير، ومدة التوقف. بصمة سلوكك تخبرها إذا كنت إنسانًا أم لا. وتُعاد هذه البيانات إلى نظام الذكاء الاصطناعي الخاص بجوجل.

لم تختَر الانضمام أبدًا، ولم يكن هناك مربع اختيار. لكن، في معظم المواقع التي تزورها الآن، أنت لا تزال تفعل ذلك.

السخرية المقلقة

كان هدف لويس فون آنه عبقريًا: تحويل الجهد الذي يهدره البشر إلى إنتاج مفيد. لكن جوجل استغلت هذه الرؤية بشكل مختلف تمامًا. استغلت آليات الأمان التي يستخدمها المستخدمون، ونشرتها في جميع أنحاء الإنترنت، وجمعت البيانات لبناء منتجات تجارية بقيمة مئات المليارات. المستخدمون لا يحصلون على شيء، بل لا يعلمون.

وأعمق سخرية هي: أنك قضيت سنوات تثبت أنك إنسان، من خلال إكمال مهام الرؤية التي لم تكن تستطيع الذكاء الاصطناعي في ذلك الوقت. وعندما تعلم الآلة هذه المهارات، لم تعد بحاجة إلى تصنيف البشر للصور.

لقد أثبت أنك إنسان، لكن النتيجة أنك أصبحت قابلاً للاستبدال.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.42Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$2.44Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$2.39Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت