Microsoft merilis model embedding teks Harrier tiga tingkat sumber terbuka, versi 27B menduduki peringkat teratas di daftar MTEB v2 multibahasa

BlockBeatNews

Berdasarkan pemantauan 1M AI News, Microsoft merilis keluarga model embedding teks multi-bahasa open source di Hugging Face bernama harrier-oss-v1, yang mencakup tiga tingkatan: 270M, 0.6B, dan 27B. Kartu model menunjukkan bahwa rangkaian ini menggunakan arsitektur decoder-only, last-token pooling, dan normalisasi L2, dengan dukungan maksimum 32768 token, serta dapat digunakan untuk penelusuran (retrieval), clustering, kemiripan semantik, klasifikasi, penambangan dwibahasa, dan reranking.

Multilingual MTEB v2 adalah tolok ukur embedding teks multi-bahasa yang umum digunakan di industri, terutama menguji tugas seperti penelusuran, klasifikasi, clustering, dan kemiripan semantik. Kartu model Microsoft menyatakan bahwa skor ketiga tingkatan model pada tolok ukur tersebut masing-masing adalah 66.5, 69.0, dan 74.3, dengan varian 27B menempati posisi teratas pada hari peluncurannya. Versi 270M dan 0.6B juga secara tambahan menggunakan model embedding yang lebih besar untuk knowledge distillation, dan ketiga model dirilis dengan lisensi MIT.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar