2025-12-10 20:06:29

還記得董事會將Sam免職的那一刻嗎？也許他們看到了我們沒有看到的東西。

看起來一個主要的AI實驗室正在推出新的安全協議，針對他們的模型。它們特別專注於建立護欄，以防止有害的輸出。現在的訓練方法包括教導模型如何處理危險的請求而不是真正執行它們。

時間點很有趣，對吧？這些安全措施是在經過數月內部辯論關於AI發展速度與責任之後推出的。技術框架涉及在生成任何模型回應之前進行多層篩選。

讓我特別注意的是：他們不再只是篩選輸出。訓練數據本身也在被重組，以從根本上嵌入安全考量。這與我們之前看到的被動審查方法不同。

不過，仍然存在疑問：這些保障措施是否能跟上系統快速演變的步伐？能力與控制之間的差距持續擴大。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

8人點讚了這條動態