Jadi Karpathy mengatakan menggunakan LLM untuk RL LLM lain itu buruk... karena LLM dapat dimanfaatkan dengan contoh adversarial yang sangat mungkin... terdengar benar
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Jadi Karpathy mengatakan menggunakan LLM untuk RL LLM lain itu buruk... karena LLM dapat dimanfaatkan dengan contoh adversarial yang sangat mungkin... terdengar benar