مايكروسوفت تفتح مصدر ثلاثة نماذج من نموذج Harrier للنصوص المدمجة، الإصدار 27B يتصدر قائمة MTEB v2 متعددة اللغات

robot
إنشاء الملخص قيد التقدم

يقول موقع CoinJie Network إن 1M AI News تراقب أن شركة Microsoft أصدرت عائلة نماذج تضمين نصوص متعددة اللغات مفتوحة المصدر على Hugging Face باسم harrier-oss-v1، والتي تتضمن ثلاث فئات: 270M و0.6B و27B. تُظهر بطاقة النموذج أن هذه السلسلة تستخدم بنية decoder-only وlast-token pooling وL2 normalization، وتدعم حدًا أقصى يصل إلى 32768 توكن، ويمكن استخدامها للاسترجاع والتجميع والتشابه الدلالي والتصنيف والتنقيب الثنائي اللغة وإعادة الترتيب. يعد Multilingual MTEB v2 معيارًا شائعًا في المجال لقياس أداء تضمين النصوص متعدد اللغات، ويختبر بشكل أساسي مهام مثل الاسترجاع والتصنيف والتجميع والتشابه الدلالي. وتزعم بطاقة نموذج Microsoft أن درجات نماذج الفئات الثلاث على هذا المعيار تبلغ على التوالي 66.5 و69.0 و74.3، حيث احتل إصدار 27B المرتبة الأولى في يوم الإطلاق. وتستخدم إصدارات 270M و0.6B أيضًا نموذج تضمين أكبر إضافيًا لإجراء تقطير معرفي، وقد تم إصدار نماذج الطرازات الثلاثة جميعها بترخيص MIT.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • تثبيت