還記得董事會將Sam免職的那一刻嗎?也許他們看到了我們沒有看到的東西。



看起來一個主要的AI實驗室正在推出新的安全協議,針對他們的模型。它們特別專注於建立護欄,以防止有害的輸出。現在的訓練方法包括教導模型如何處理危險的請求而不是真正執行它們。

時間點很有趣,對吧?這些安全措施是在經過數月內部辯論關於AI發展速度與責任之後推出的。技術框架涉及在生成任何模型回應之前進行多層篩選。

讓我特別注意的是:他們不再只是篩選輸出。訓練數據本身也在被重組,以從根本上嵌入安全考量。這與我們之前看到的被動審查方法不同。

不過,仍然存在疑問:這些保障措施是否能跟上系統快速演變的步伐?能力與控制之間的差距持續擴大。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 轉發
  • 分享
留言
0/400
Sunday Degenvip
· 7小時前
哈...Sam那事兒還真有點意思,現在看safety這套動作確實有點後知後覺了 話說這種事兒吧,防的再多也追不上迭代速度,感覺還是在補窟窿 多層篩選聽著不錯,但底層數據能改得了啥呢...就是換個角度賣出同樣的東西
查看原文回復0
链上资深数据侦探vip
· 12-10 20:23
sam被趕下台那事兒,現在看確實有點蹊蹺...這幫人搞安全協議是真的還是做做樣子呢
查看原文回復0
Gas_FeeSobbervip
· 12-10 20:23
哈,Sam那事兒後才搞安全協議?多少有點晚啊
查看原文回復0
机枪池难民vip
· 12-10 20:10
說白了還是膽怯了吧,想起來趕緊補救一下
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)