Google Công bố Thuật toán TurboQuant Mới: Có thể Nén Nhu cầu Bộ nhớ AI 6 Lần, Cổ phiếu Bộ nhớ Giảm hàng loạt

動區BlockTempo

Google công bố thuật toán nén TurboQuant không cần đào tạo, tuyên bố có thể giảm ít nhất 6 lần nhu cầu bộ nhớ AI; thông tin này vừa phát ra, cổ phiếu bộ nhớ đồng loạt sụt giảm, nhưng các nhà phân tích có ý kiến khác nhau.
(Tiền đề: Google đặt mục tiêu hoàn thành chuyển đổi mã hóa lượng tử vào năm 2029, sớm hơn mục tiêu của chính phủ 6 năm, ngành công nghiệp mã hóa cần bắt kịp)
(Bổ sung bối cảnh: Wall Street Journal: Trump dự kiến bổ nhiệm Zuckerberg, Huang Renxun, Elon Musk vào PCAST, xây dựng “Đội tuyển AI quốc gia Mỹ”)

Một thuật toán mới khiến cổ phiếu bộ nhớ sụp đổ toàn diện? Google Research chính thức công bố TurboQuant vào ngày 25, tuyên bố có thể định lượng KV cache của các mô hình ngôn ngữ lớn (LLM) chỉ còn 3 bit, mà không làm giảm độ chính xác của mô hình, đồng thời giảm ít nhất 6 lần lượng bộ nhớ sử dụng.

Sau khi thông tin lan truyền, tập đoàn bộ nhớ Micron đã giảm giá mạnh 6,1% trong phiên, đóng cửa ở mức 382,09 USD, mức thấp nhất trong 3 tuần. Trong khi đó, Sandisk giảm 3,5%, Seagate giảm 2,59%, Western Digital giảm 1,63%, toàn bộ nhóm cổ phiếu bộ nhớ đều bị ảnh hưởng tiêu cực.

Thị trường châu Á hôm nay cũng chịu áp lực, Samsung Electronics mở cửa giảm 3,6%, SK Hynix giảm 4,5%. Các nhà đầu tư lý giải đơn giản: nếu mô hình AI không còn cần nhiều bộ nhớ nữa, sức mạnh định giá do thiếu linh kiện trong thời gian gần đây có thể sẽ bị lung lay.

Phân tích công nghệ TurboQuant: Loại bỏ sai số hai giai đoạn, tốc độ nhanh gấp 8 lần

KV cache (Key-Value Cache) là cơ chế cốt lõi giúp LLM “nhớ” dữ liệu đã xử lý, lưu trữ các dữ liệu chú ý đã tính toán trước đó, giúp mô hình không cần tính lại mỗi khi sinh token mới. Tuy nhiên, khi khung ngữ cảnh mở rộng liên tục, KV cache đã trở thành một điểm nghẽn lớn về bộ nhớ.

TurboQuant nhắm vào chính điểm đau này. Google chỉ ra rằng, phương pháp định lượng vector truyền thống sẽ tạo ra thêm khoảng 1 đến 2 bit chi phí cho mỗi giá trị trong bộ nhớ, trong khi TurboQuant loại bỏ hoàn toàn gánh nặng này qua quy trình hai giai đoạn:

Giai đoạn 1, sử dụng phương pháp PolarQuant để xoay dữ liệu vector, đạt được nén chất lượng cao

Giai đoạn 2, dùng thuật toán Johnson-Lindenstrauss đã định lượng để loại bỏ sai số còn lại

Trong thử nghiệm trên GPU H100 của Nvidia, TurboQuant 4 bit đạt hiệu năng gấp 8 lần so với khóa 32 bit chưa định lượng khi tính toán độ chú ý, đồng thời giảm ít nhất 6 lần dung lượng bộ nhớ KV cache.

Điều quan trọng hơn, thuật toán này không cần đào tạo hay tinh chỉnh, tiêu thụ ít tài nguyên khi chạy, phù hợp để triển khai trực tiếp trong môi trường suy luận chính thức và hệ thống tìm kiếm vector quy mô lớn. Chính thức, bài báo liên quan sẽ được công bố tại hội nghị “ICLR 2026” vào tháng 4.

Nghịch lý Jensen: Nhu cầu bộ nhớ có thể còn lớn hơn?

Tuy nhiên, không phải ai cũng đồng tình với câu chuyện “tận thế của bộ nhớ”.

Một số nhà phân tích đưa ra nghịch lý Jensen: khi công nghệ tiến bộ giảm chi phí sử dụng tài nguyên, thì chính việc dễ dàng tiếp cận tài nguyên lại thúc đẩy nhu cầu tổng thể tăng lên. Người ủng hộ cho rằng, nếu TurboQuant thực sự giúp giảm đáng kể rào cản suy luận AI, sẽ thúc đẩy phổ biến mô hình AI nhanh hơn, cuối cùng còn làm tăng nhu cầu bộ nhớ quy mô lớn, chứ không phải giảm.

Nhà phân tích của Lynx Equity Strategies trong báo cáo còn trực tiếp hơn: “Phương pháp mà Google mô tả sẽ gần như không làm giảm nhu cầu về bộ nhớ và bộ nhớ flash trong 3 đến 5 năm tới, vì nguồn cung vẫn còn cực kỳ hạn chế.” Do đó, tổ chức này duy trì mục tiêu giá 700 USD cho cổ phiếu của Micron.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận