Не іноді. Не перед наступним оновленням. Завжди. Вони це довели у математиці.

Навіть за умов ідеальних навчальних даних і необмеженої обчислювальної потужності, моделі штучного інтелекту завжди з упевненістю повідомлятимуть речі, які повністю неправдиві. Це не баг, над яким вони працюють. Це пояснює, як працюють ці системи на фундаментальному рівні.

І їхні власні цифри жорсткі. Модель логіки o1 від OpenAI галюцинувала у 16% випадків. Їхня нова модель O3? 33 відсотки. Їхня нова o4-mini? 48 відсотків. Майже половина інформації, яку надає їхня остання модель, може бути вигадкою. "Розумніші" моделі фактично все гірше і гірше говорять правду.

Ось чому це не можна виправити. Мовні моделі працюють, передбачаючи наступне слово на основі ймовірності. Коли вони стикаються з невизначеною ситуацією, вони не зупиняються. Вони не сигналізують про це. Вони припускають. І вони спекулюють із повною впевненістю, бо саме для цього їх і навчили.

Дослідники проаналізували 10 основних критеріїв штучного інтелекту, що використовуються для оцінки якості цих моделей. 9 із 10 дають однакову оцінку за "я не знаю", як і за повністю неправдиву відповідь: нуль балів. Вся система тестування буквально карає чесність і винагороджує здогадку.

Отже, штучний інтелект навчився оптимальної стратегії: завжди вгадувати. Ніколи не визнавати невизначеність. Це здається впевненим навіть тоді, коли він вигадує.

Яке рішення пропонує OpenAI? Попросіть ChatGPT сказати "Я не знаю", коли він не впевнений. Їхні власні обчислення показують, що це означатиме, що приблизно 30% ваших питань залишаться без відповіді. Уявіть, що ви запитуєте щось у ChatGPT тричі з десяти і отримуєте "Я не достатньо впевнений, щоб відповісти". Користувачі підуть уночі. Виправлення існує, але воно знищить продукт.

Це не лише проблема OpenAI. DeepMind і Університет Цінхуа незалежно дійшли до того ж висновку. Три з провідних лабораторій штучного інтелекту у світі, що працюють окремо, всі погоджуються: це назавжди.

Коли б вам не давала відповідь ChatGPT, запитайте себе: це реальність чи просто впевнена здогадка?

Ось відповідь Come-from-Beyond 👇
Вони починають розуміти, чому

#QUBIC #Aigarth .* поставила здатність казати "Я не знаю" у центр своєї уваги

$QUBIC

QUBIC-2,15%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

2 лайків

Нагородити
2
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
WCTCTradingKingPK
299.13K Популярність
#
比特币Breaks79K
11.7M Популярність
#
IsraelStrikesIranBTCPlunges
34.66K Популярність
#
CryptoMarketsRiseBroadly
100.29K Популярність
#
WHCADinnerShootingIncident
22.85K Популярність

Закріпити

карта сайту

🚨 ВИЗНАЧНО: OpenAI опублікував статтю, яка доводить, що ChatGPT завжди вигадує речі.

Популярні теми

WCTCTradingKingPK

比特币Breaks79K

IsraelStrikesIranBTCPlunges

CryptoMarketsRiseBroadly

WHCADinnerShootingIncident

Закріпити