Эта статья Sentient честно заставила меня пересмотреть, насколько "устойчивы" на самом деле большинство методов отпечатков LLM. Многое из предыдущих работ работает только в случае, если хост модели ведет себя хорошо. Но в реальном мире хосты этого не делают. И как только вы предполагаете наличие враждебного хоста, многие схемы отпечатков тихо
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Эта статья Sentient честно заставила меня пересмотреть, насколько "устойчивы" на самом деле большинство методов отпечатков LLM. Многое из предыдущих работ работает только в случае, если хост модели ведет себя хорошо. Но в реальном мире хосты этого не делают. И как только вы предполагаете наличие враждебного хоста, многие схемы отпечатков тихо