Google Gemma 4 chính thức ra mắt: 4 kích thước lần đầu tiên theo giấy phép Apache 2.0, 31B là dự án mã nguồn mở toàn cầu thứ ba

BlockBeatNews

2026-04-03 00:36:41

Theo thông tin theo dõi của 1M AI News, Google chính thức phát hành gia đình mô hình mã nguồn mở Gemma 4, bao gồm 4 phiên bản với kích thước khác nhau, tất cả đều sử dụng giấy phép Apache 2.0. Google cho biết đây là phản hồi trước những ý kiến đóng góp từ cộng đồng. Apache 2.0 có nghĩa là nhà phát triển có thể tự do sử dụng cho mục đích thương mại, sửa đổi và phân phối, không bị ràng buộc thêm. Đồng sáng lập kiêm CEO của Hugging Face Clément Delangue gọi động thái này là “mốc son vĩ đại”.

4 mô hình nhắm đến các bối cảnh phần cứng khác nhau:

31B Dense: chất lượng gốc cao nhất, phù hợp cho tinh chỉnh; trọng số chưa lượng tử có thể chạy trên một GPU đơn 80GB H100, phiên bản lượng tử hỗ trợ GPU tầm trung cấp phổ thông
26B MoE (Hỗn hợp chuyên gia): tổng tham số 26B nhưng khi suy luận chỉ kích hoạt 3.8B, tập trung vào độ trễ thấp, phù hợp cho các tác vụ Agent nhạy cảm với tốc độ
E4B và E2B: mô hình biên cho thiết bị di động và IoT; khi suy luận lần lượt kích hoạt khoảng 4B và 2B tham số là đủ để duy trì thời lượng pin thiết bị, hỗ trợ gốc đầu vào âm thanh (nhận dạng và hiểu giọng nói), có thể chạy hoàn toàn offline

Trên bảng xếp hạng văn bản của nền tảng đánh giá ẩn danh đối đầu với mô hình lớn Arena AI, 31B đứng thứ ba trong số các mô hình mã nguồn mở trên toàn cầu, 26B đứng thứ sáu; Google cho biết đó là “mô hình vượt qua quy mô 20 lần”. Mô hình được xây dựng dựa trên cùng nghiên cứu và công nghệ với Gemini 3.

Năng lực cốt lõi bao gồm suy luận và lập kế hoạch nhiều bước, gọi hàm gốc và đầu ra JSON được cấu trúc (hướng đến quy trình làm việc của Agent), tạo sinh mã, hiểu biết về hình ảnh và video (toàn bộ dải), và huấn luyện gốc trên hơn 140 ngôn ngữ. Các mô hình biên hỗ trợ cửa sổ ngữ cảnh 128K, trong khi các mô hình lớn hỗ trợ tối đa 256K. E2B và E4B được tối ưu hóa chung với đội ngũ Pixel của Google, Qualcomm và MediaTek, có thể chạy trên các thiết bị như điện thoại, Raspberry Pi, NVIDIA Jetson Orin Nano; nhà phát triển Android có thể xây dựng ứng dụng Agent thông qua nguyên mẫu AICore Developer Preview để chuẩn bị tính tương thích cho Gemini Nano 4 tiếp theo.

Về hệ sinh thái, ngay trong ngày đầu đã hỗ trợ các khung công cụ phổ biến như Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth… Có thể trải nghiệm trực tiếp trên Google AI Studio (31B và 26B) và AI Edge Gallery (E4B và E2B). Từ lần phát hành đầu tiên, chuỗi Gemma đã được tải xuống hơn 400 triệu lượt, và cộng đồng đã tạo ra hơn 100 nghìn biến thể.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận