Отже, Карпати сказав, що використання LLM для RL інших LLM є поганим... тому що LLM можна обіграти за допомогою високої ймовірності суперечливих прикладів... звучить вірно
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Отже, Карпати сказав, що використання LLM для RL інших LLM є поганим... тому що LLM можна обіграти за допомогою високої ймовірності суперечливих прикладів... звучить вірно