Bài báo Sentient này thật sự khiến tôi phải suy nghĩ lại về mức độ "bền vững" của phần lớn các phương pháp nhận dạng LLM. Rất nhiều công trình trước chỉ đúng khi máy chủ mô hình hành xử tốt. Nhưng trong thế giới thực, các máy chủ sẽ không như vậy. Và một khi bạn giả định một máy chủ đối địch, nhiều phương pháp nhận dạng sẽ âm thầm
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Bài báo Sentient này thật sự khiến tôi phải suy nghĩ lại về mức độ "bền vững" của phần lớn các phương pháp nhận dạng LLM. Rất nhiều công trình trước chỉ đúng khi máy chủ mô hình hành xử tốt. Nhưng trong thế giới thực, các máy chủ sẽ không như vậy. Và một khi bạn giả định một máy chủ đối địch, nhiều phương pháp nhận dạng sẽ âm thầm