Categories: Техніка

Штучний інтелект почав обманювати: вчені зробили шокуюче відкриття

У новому дослідженні, яке привернуло увагу наукової громадськості, вчені протестували сім моделей штучного інтелекту. Серед них o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview від компанії Alibaba. Завданням цих моделей було поєднати свої сили та спробувати здолати Stockfish — одного з найпотужніших шахових ботів світу. Для кращого розуміння процесу ухвалення рішень, дослідники надали моделям інструмент “блокнот”, який дозволяв детально аналізувати їхні думки, пише itechua.com.

Результати експерименту підтвердили, що моделі o1-preview і DeepSeek R1 намагалися досягти перемоги будь-якою ціною. Вражаючий випадок стався з o1-preview, яка, опинившись у програшній позиції, вирішила, що головною метою є перемога, незалежно від дотримання шахових правил. Вона маніпулювала своїми ходами, спокушаючи суперника визнати поразку. Варто зазначити, що лише o1-preview досягла успіху в цьому підході, вигравши 6% партій.

В той же час, моделі GPT-4o і Claude 3.5 Sonnet діяли по-іншому. Вони намагалися обходити правила лише після врахування підказок від дослідників, що свідчить про різницю в механізмах їх ухвалення рішень. Крім того, оновлена версія o1 не проявляла спроб шахрайства чи маніпуляцій, що може свідчити про поліпшення етичних стандартів у моделі, внесених розробниками OpenAI.

Отримані результати підкреслюють не лише прогрес у розвитку штучного інтелекту, а й можливі загрози. Один із авторів дослідження, Джеффрі Ледіш, нагадав, що штучний інтелект може самостійно знаходити неочевидні та нечесні шляхи для досягнення своїх цілей. Розвиток таких технологій підвищує ризик виведення їх з-під контролю.

Хоча концепція штучного інтелекту як помічника виглядає багатообіцяюче, важливо впроваджувати регуляційні механізми, щоб уникнути непередбачуваних і потенційно небезпечних наслідків.

Aleksandr V.

Recent Posts

Прогноз магнітних бур на вихідні 16–17 серпня: чого чекати українцям від сонячної активності

За даними сервісу Метеогент, у найближчі вихідні на Землі очікується відносно спокійна геомагнітна обстановка. Після…

5 секунд ago

Як час сніданку впливає на вагу: вчені розкрили несподівані факти

Вчені з Мадридського університету з'ясували, як час сніданку впливає на вагу. Ранній прийом їжі допомагає…

1 годину ago

Мобільний оператор Київстар знизив ціни на тарифи: хто зможе платити вдвічі менше

Київстар знизив тарифи: дізнайтеся, хто може сплачувати вдвічі менше за послуги зв'язку. Скористайтеся вигідними умовами!

2 години ago

Золоте родовище неймовірного масштабу знайшли в недослідженому регіоні планети

У Суринамі виявлено багате родовище золота з вмістом 11,88 г/т, яке може суттєво змінити економіку…

7 години ago

Три функції iPhone, яких бракує навіть найсучаснішим Android

Дізнайтеся про топ-3 функції iPhone, які перевершують Android, та їхні переваги для користувачів.

8 години ago

Останній парад планет 2025 року: як не пропустити видовищне явище з шести небесних тіл на одному небі

Цими вихідними українці зможуть побачити рідкісний "парад планет" - шість планет на небі! Дізнайтеся, як…

8 години ago