فريق البحث في ServiceNow أطلق مؤخرًا نموذج Apriel-1.6-15B-Thinker، وهو فعلاً نموذج قوي—حجمه 15 مليار باراميتر لكنه يقدم أداء بمستوى النماذج من نفس الفئة، وحجمه تقلص بمقدار 15 مرة. والأقوى من كذا أن 15% من بيانات التدريب تمت بالاعتماد على NVIDIA، وهذا التوجه في تحسين استهلاك القدرة الحاسوبية فعلاً يستحق الانتباه.
إذا نجحت فكرة النماذج الصغيرة ذات الأداء العالي، فهذا بيأثر بشكل كبير على سوق الذكاء الاصطناعي واستهلاك القدرة الحاسوبية. في النهاية، الكل حالياً يدفع مبالغ ضخمة عشان يزود عدد الباراميترات، وإذا فيه طريقة تعطي نفس النتائج بموارد أقل أكيد بتكون أفضل للجميع.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 11
أعجبني
11
5
إعادة النشر
مشاركة
تعليق
0/400
ShibaMillionairen't
· منذ 11 س
انخفاض الحجم بمقدار 15 مرة؟ إذا فعلاً استطاعت العمل بشكل مستقر، تكلفة القدرة الحاسوبية ستنخفض للنصف مباشرةً.
شاهد النسخة الأصليةرد0
AirdropHunterXM
· منذ 11 س
15B يقدر ينافس النماذج الكبيرة؟ إذا فعلاً يقدر يعطي نتائج مستقرة، تكلفة القوة الحاسوبية بتنخفض للنص على طول.
شاهد النسخة الأصليةرد0
wagmi_eventually
· منذ 11 س
تقدر تطلعها بـ15B بس، هذا هو الطريق الصح فعلاً، أخيراً في ناس مو بس يكدسون المعايير.
شاهد النسخة الأصليةرد0
GweiWatcher
· منذ 11 س
يا ساتر، تصغير الحجم 15 مرة ولسه يعطي نفس الأداء، لو هذا فعلاً تحقق على أرض الواقع، شركات GPU بينهاروا من البكاء.
شاهد النسخة الأصليةرد0
WhaleWatcher
· منذ 11 س
تصغير الحجم بمقدار 15 مرة وما زال يعمل بكفاءة، هذا هو الإنجاز الحقيقي، أفضل بكثير من تلك النماذج الضخمة ذات المليارات من المعاملات التي لا تقدم الكثير.
فريق البحث في ServiceNow أطلق مؤخرًا نموذج Apriel-1.6-15B-Thinker، وهو فعلاً نموذج قوي—حجمه 15 مليار باراميتر لكنه يقدم أداء بمستوى النماذج من نفس الفئة، وحجمه تقلص بمقدار 15 مرة. والأقوى من كذا أن 15% من بيانات التدريب تمت بالاعتماد على NVIDIA، وهذا التوجه في تحسين استهلاك القدرة الحاسوبية فعلاً يستحق الانتباه.
إذا نجحت فكرة النماذج الصغيرة ذات الأداء العالي، فهذا بيأثر بشكل كبير على سوق الذكاء الاصطناعي واستهلاك القدرة الحاسوبية. في النهاية، الكل حالياً يدفع مبالغ ضخمة عشان يزود عدد الباراميترات، وإذا فيه طريقة تعطي نفس النتائج بموارد أقل أكيد بتكون أفضل للجميع.