Theo thông tin theo dõi của 1M AI News, Google chính thức phát hành gia đình mô hình mã nguồn mở Gemma 4, bao gồm 4 phiên bản với kích thước khác nhau, tất cả đều sử dụng giấy phép Apache 2.0. Google cho biết đây là phản hồi trước những ý kiến đóng góp từ cộng đồng. Apache 2.0 có nghĩa là nhà phát triển có thể tự do sử dụng cho mục đích thương mại, sửa đổi và phân phối, không bị ràng buộc thêm. Đồng sáng lập kiêm CEO của Hugging Face Clément Delangue gọi động thái này là “mốc son vĩ đại”.
4 mô hình nhắm đến các bối cảnh phần cứng khác nhau:
Trên bảng xếp hạng văn bản của nền tảng đánh giá ẩn danh đối đầu với mô hình lớn Arena AI, 31B đứng thứ ba trong số các mô hình mã nguồn mở trên toàn cầu, 26B đứng thứ sáu; Google cho biết đó là “mô hình vượt qua quy mô 20 lần”. Mô hình được xây dựng dựa trên cùng nghiên cứu và công nghệ với Gemini 3.
Năng lực cốt lõi bao gồm suy luận và lập kế hoạch nhiều bước, gọi hàm gốc và đầu ra JSON được cấu trúc (hướng đến quy trình làm việc của Agent), tạo sinh mã, hiểu biết về hình ảnh và video (toàn bộ dải), và huấn luyện gốc trên hơn 140 ngôn ngữ. Các mô hình biên hỗ trợ cửa sổ ngữ cảnh 128K, trong khi các mô hình lớn hỗ trợ tối đa 256K. E2B và E4B được tối ưu hóa chung với đội ngũ Pixel của Google, Qualcomm và MediaTek, có thể chạy trên các thiết bị như điện thoại, Raspberry Pi, NVIDIA Jetson Orin Nano; nhà phát triển Android có thể xây dựng ứng dụng Agent thông qua nguyên mẫu AICore Developer Preview để chuẩn bị tính tương thích cho Gemini Nano 4 tiếp theo.
Về hệ sinh thái, ngay trong ngày đầu đã hỗ trợ các khung công cụ phổ biến như Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth… Có thể trải nghiệm trực tiếp trên Google AI Studio (31B và 26B) và AI Edge Gallery (E4B và E2B). Từ lần phát hành đầu tiên, chuỗi Gemma đã được tải xuống hơn 400 triệu lượt, và cộng đồng đã tạo ra hơn 100 nghìn biến thể.