Karpathy: Nhận thức về năng lực AI xuất hiện một sự đứt gãy nghiêm trọng, phiên bản miễn phí và Agent tiên tiến là “một sản phẩm hoàn toàn khác nhau”

Trước Tổng giám đốc AI của Tesla, đồng sáng lập viên OpenAI Andrej Karpathy vào ngày 9 tháng 4 đã đăng một bài viết dài trên X, chỉ ra rằng nhận thức của công chúng về năng lực của AI đang bị chia rẽ một cách nghiêm trọng. Ông cho rằng, những người sử dụng ChatGPT bản miễn phí và những kỹ thuật viên sử dụng hằng ngày các công cụ agent tiên tiến như Codex, Claude Code thực chất đang thảo luận về « những sản phẩm hoàn toàn khác nhau », nhưng cả hai bên đều tin rằng thứ mình nhìn thấy chính là toàn bộ bức tranh của AI.

Hai thế giới, hai kiểu nhận thức về AI

Karpathy hiện chia những người dùng AI thành hai nhóm.

Nhóm thứ nhất là những người đã thử ChatGPT bản miễn phí vào một thời điểm nào đó trong năm ngoái, rồi từ đó hình thành ấn tượng tổng thể về AI. Họ nhìn thấy vô số sai sót của mô hình — ảo giác, kết quả tìm kiếm lạc lối, và ngay cả các vấn đề đơn giản như chế độ giọng nói “nên lái xe hay đi bộ rồi đến tiệm rửa xe” cũng bị nó làm hỏng. Karpathy thừa nhận rằng những vấn đề này thực sự tồn tại, nhưng nhấn mạnh rằng bản miễn phí và các mô hình đã lỗi thời không thể đại diện cho năng lực thực sự của các mô hình agent tiên tiến trước năm 2026.

Nhóm thứ hai thỏa mãn đồng thời hai điều kiện: trả phí để sử dụng các mô hình agent tiên tiến mới nhất (như OpenAI Codex hoặc Claude Code), và sử dụng chuyên nghiệp trong các lĩnh vực kỹ thuật như phát triển phần mềm, toán học, nghiên cứu. Karpathy gọi nhóm người này đang trải qua cú “tấn công tinh thần AI” (AI Psychosis) ở mức độ cao, bởi những tiến bộ gần đây trong lĩnh vực kỹ thuật của các mô hình này “chỉ có thể mô tả là kinh ngạc” — bạn có thể chứng kiến trực tiếp chúng giải quyết các vấn đề kiến trúc phần mềm vốn trước đó cần tới vài ngày, thậm chí vài tuần, chỉ trong vòng một giờ.

Tại sao sự tiến bộ tập trung mạnh ở lĩnh vực kỹ thuật

Karpathy giải thích lý do vì sao việc nâng cao năng lực AI lại đặc biệt rõ rệt trong các lĩnh vực kỹ thuật như phát triển phần mềm, nhưng trong các mục đích phổ thông như tìm kiếm, viết lách, đưa ra gợi ý thì không nổi bật bằng.

Có hai nguyên nhân: thứ nhất, lĩnh vực kỹ thuật cung cấp hàm thưởng có thể kiểm chứng được (ví dụ: kiểm tra xem unit test có pass hay không), nhờ đó huấn luyện tăng cường học (reinforcement learning) vận hành hiệu quả; trong khi đó, việc đánh giá đúng sai kém của chất lượng bài viết khó xác định một cách rõ ràng. Thứ hai, trong các kịch bản B2B, lĩnh vực kỹ thuật mang giá trị thương mại cao hơn, nên các công ty AI đổ vào những hướng này tỷ lệ lớn nhất nguồn lực của đội ngũ.

Hai nhóm không hiểu nhau đang nói gì

Karpathy kết luận rằng hai nhóm người này đang “mỗi bên nói một câu”. Chế độ giọng nói của OpenAI bản miễn phí làm hỏng các vấn đề thường ngày, còn OpenAI bản trả phí cao cấp Codex thì trong vòng một giờ có thể tái cấu trúc toàn bộ kho mã hoặc phát hiện lỗ hổng của hệ thống — cả hai điều đó đều đúng.

Trong phần phản hồi tiếp theo, ông bổ sung rằng có người đã nêu với ông một quan điểm: sự kiện OpenClaw gây ra sự quan tâm lớn đến vậy trong xã hội, chính là vì nó khiến một lượng lớn người không thuộc giới kỹ thuật lần đầu tiên tiếp cận các mô hình agent tiên tiến, trong khi trước đó họ chỉ biết rằng AI tương đương với ChatGPT phiên bản web.

Bài viết Karpathy: Nhận thức về năng lực AI xuất hiện sự đứt gãy nghiêm trọng, bản miễn phí và agent tiên tiến là “những sản phẩm hoàn toàn khác nhau” lần đầu xuất hiện trên Chainews ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Trưởng bộ phận mô hình AI của Xiaomi: Cuộc cạnh tranh AI đang chuyển sang thời đại Agent; tự tiến hóa là sự kiện then chốt dẫn tới AGI

Người phụ trách đội ngũ mô hình lớn của Xiaomi, La Fuli, đã có một cuộc phỏng vấn chuyên sâu trên nền tảng Bilibili vào ngày 24 tháng 4 (mã video: BV1iVoVBgERD). Thời lượng cuộc phỏng vấn là 3,5 giờ, và đây là lần đầu tiên cô công khai trình bày một cách có hệ thống các quan điểm kỹ thuật của mình với tư cách là người phụ trách kỹ thuật. La Fuli cho biết, cuộc đua cạnh tranh của các mô hình lớn đã chuyển từ thời đại Chat sang thời đại Agent, đồng thời chỉ ra rằng “tự tiến hoá” sẽ là sự kiện then chốt của AGI trong năm tới.

MarketWhisper25phút trước

Tencent Cloud QClaw tích hợp vào khung Hermes, hỗ trợ chuyển đổi nhiều mô hình như DeepSeek-V4 Pro

Theo thông báo chính thức của Tencent Cloud vào ngày 27 tháng 4, công cụ AI Agent trên máy tính QClaw của Tencent Cloud đã chính thức phát hành phiên bản v0.2.14. Tencent Cloud cho biết đây là bản nâng cấp có quy mô lớn nhất của QClaw cho đến nay; các cập nhật cốt lõi bao gồm tích hợp khung Hermes Agent, nâng cấp mô hình nền tảng lên chế độ tự do chuyển đổi và việc “Sàn cảm hứng” được nâng cấp toàn diện thành “Sàn chuyên gia”.

MarketWhisper32phút trước

xAI Grok Voice tiếp quản đường dây nóng chăm sóc khách hàng của Starlink, 70% cuộc gọi được tự động kết án

Theo thông báo chính thức của xAI được phát hành vào ngày 23 tháng 4, xAI đã giới thiệu tác nhân AI giọng nói Grok Voice Think Fast 1.0 và đã được triển khai trên đường dây nóng dịch vụ khách hàng Starlink +1 (888) GO STARLINK. Theo dữ liệu thử nghiệm được công bố trong thông báo, 70% các cuộc gọi được AI tự động xử lý chấm dứt, không cần sự can thiệp của con người.

MarketWhisper36phút trước

Hệ sinh thái FLOA ra mắt bộ AI FloaClaw với ma trận kỹ năng đa kịch bản

Tin tức từ Gate, ngày 27 tháng 4 — Hệ sinh thái FLOA đã chính thức ra mắt FloaClaw, bộ công cụ AI cốt lõi của mình, với ma trận kỹ năng AI đa kịch bản. Quyền truy cập vào các chức năng của FloaClaw chỉ giới hạn cho người dùng Agent từ cấp 3 trở lên. FloaClaw hoạt động theo hệ thống dựa trên token, trong đó người dùng mua token sức mạnh tính toán được hỗ trợ bởi BNB để tiêu thụ [AI skills]https://www.gate.com/zh/skills-hub,, với mức tiêu thụ được điều chỉnh theo độ phức tạp của tác vụ. Nền tảng có kế hoạch liên tục mở rộng với các kỹ năng AI và mô-đun công cụ mới. FLOA cũng sẽ giới thiệu hệ thống chia sẻ doanh thu cho người tạo, cho phép các nhà sáng tạo Agent kiếm được một phần token sức mạnh tính toán từ việc người dùng tiêu thụ kỹ năng, với hỗ trợ rút BNB chỉ bằng một lần nhấp để xây dựng một nền kinh tế nhà sáng tạo bền vững. FLOA là nền tảng hệ sinh thái Web3 Agent thông minh được xây dựng trên BNB Chain, tích hợp khả năng phân tích dữ liệu và tự động hóa on-chain với cơ chế khuyến khích mở nhằm trao quyền cho người dùng và thúc đẩy tăng trưởng hệ sinh thái.

GateNews57phút trước

Bộ trưởng Ngoại giao Singapore Triển Khai Trợ Lý AI Tùy Chỉnh trên Raspberry Pi Bằng Claude Code

Tin tức Cổng, ngày 27 tháng 4 — Bộ trưởng Ngoại giao Singapore Vivian Balakrishnan gần đây cho biết ông đã xây dựng một hệ thống trợ lý AI tùy chỉnh, mà ông gọi là "bộ não thứ hai của nhà ngoại giao," chạy trên Raspberry Pi 5 (một máy vi tính cỡ thẻ tín dụng). Hệ thống tích hợp với WhatsApp và

GateNews2giờ trước

Các Nền Tảng Thương Mại Điện Tử Ấn Độ Ra Mắt Cửa Hàng AI Cho ChatGPT, Perplexity và Gemini

Tin Cổng, ngày 27 tháng 4 — Các nền tảng thương mại điện tử của Ấn Độ Flipkart, BigBasket, Ajio và FirstCry đang xây dựng các cửa hàng AI cho ChatGPT, Perplexity và Google Gemini để hỗ trợ thương mại mang tính tác nhân (agentic commerce), nơi các công cụ AI mua sắm thay mặt người dùng. Công ty quick commerce Swiggy cũng đã xây dựng các bộ kết nối cho ChatGP

GateNews2giờ trước
Bình luận
0/400
Không có bình luận