Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 30 mô hình AI, với 0% phí bổ sung
Tôi thấy câu chuyện về NVIDIA với Groq rất thú vị. Về cơ bản, những gì Huang Renxun giải thích bây giờ rất hợp lý về chiến lược.
Toàn bộ chuyện bắt đầu khi thị trường suy luận thay đổi. Trước đây, mọi người chỉ tập trung vào một điều: tăng throughput, xử lý nhiều yêu cầu cùng lúc. Nhưng sau đó mọi người nhận ra rằng không phải lúc nào cũng như vậy trong thực tế. Một số người dùng sẵn sàng trả nhiều hơn để có phản hồi nhanh hơn, bất kể tổng khối lượng.
Nó giống như thế này: bạn có hai mô hình giống nhau, nhưng một phản hồi trong 50ms và một trong 500ms. Nếu bạn là một kỹ sư phát triển ứng dụng thời gian thực, bạn sẽ trả thêm bao nhiêu để có mô hình nhanh gấp 10 lần? Đúng vậy, thị trường độ trễ thấp hoàn toàn khác với thị trường throughput cao.
Rồi Groq tham gia vào câu chuyện này. Kiến trúc LPU của họ chính xác là chuyên biệt cho điều đó, về độ trễ xác định thấp. Trong khi các GPU của NVIDIA thống trị về mặt throughput khối lượng lớn, Groq lấp đầy một khoảng trống hoàn toàn khác. Khi nhìn vào Groq 3 LPU ra mắt tháng 3, được làm bằng 4nm của Samsung, khả năng suy luận trên mỗi megawatt của các mô hình nghìn tỷ lớn gấp 35 lần so với Blackwell NVL72. Điều này không phải là nhỏ.
Những gì Huang đang nói về cơ bản là NVIDIA nhận ra rằng không tồn tại một thị trường suy luận duy nhất, mà có hai phân khúc rất khác nhau với các động thái định giá hoàn toàn khác nhau. Bạn có thể có throughput thấp hơn, nhưng nếu giá mỗi token cao hơn nhiều, vẫn có lợi. Đó là mở rộng biên giới Pareto của thị trường.
Đây là một nước đi rất có chiến lược của NVIDIA, thực sự vậy. Họ nhận diện được một khoảng trống và đã theo đuổi nó. Jonathan Ross và đội của Groq vẫn hoạt động độc lập, nhưng giờ đây có toàn bộ sức mạnh của NVIDIA hậu thuẫn. Có vẻ cuối cùng ai đó đang nghĩ về suy luận một cách tinh vi hơn.