Tin tức Gate News, ngày 17 tháng 3, Nvidia chính thức ra mắt Vera CPU tại hội nghị GTC, đây là bộ xử lý đầu tiên được thiết kế đặc biệt cho Agent AI và học tăng cường. Khi AI mở rộng từ tạo ra và suy luận sang hành động tự chủ của Agent, các công việc như lập kế hoạch, gọi công cụ, thực thi mã, xác nhận kết quả đòi hỏi CPU phải đáp ứng nhanh chóng. CEO của Nvidia, Huang Renxun, cho biết: “CPU không còn chỉ là hỗ trợ cho mô hình, nó đang thúc đẩy mô hình.”
Vera sử dụng 88 lõi Olympus tự phát triển của Nvidia, mỗi lõi có thể thực thi đồng thời hai nhiệm vụ nhờ công nghệ Multithreading Không gian, phù hợp cho các nhà máy AI đa thuê bao thực hiện hàng loạt công việc song song. Bộ nhớ sử dụng thế hệ thứ hai của hệ thống con tiêu thụ điện năng thấp LPDDR5X, băng thông đạt 1.2 TB/s, gấp đôi so với CPU thông thường, tiêu thụ điện năng giảm một nửa.
Các nhà cung cấp dịch vụ đám mây đã lên kế hoạch triển khai bao gồm Alibaba, ByteDance, Cloudflare, CoreWeave, Lambda, Nebius, Oracle Cloud (OCI), Together.AI, Vultr và nhiều nhà khác. Về phần phần cứng, 19 nhà sản xuất như Dell Technologies, HPE, Lenovo, Supermicro đã bắt đầu thích nghi. Michael Truell, đồng sáng lập kiêm CEO của Cursor, công cụ lập trình AI, cho biết sẽ sử dụng Vera để nâng cao khả năng xử lý và phản hồi của Agent lập trình. Nền tảng dữ liệu luồng Redpanda đã thử nghiệm Vera chạy tải trọng tương thích Apache Kafka, giảm độ trễ tối đa 5.5 lần. Các phòng thí nghiệm quốc gia Los Alamos, Lawrence Berkeley, trung tâm tính toán cao cấp Texas cũng đã lên kế hoạch triển khai. Vera CPU đã bước vào sản xuất hàng loạt và sẽ được xuất xưởng qua các đối tác trong nửa cuối năm nay.