Categories: Техніка

Штучний інтелект почав обманювати: вчені зробили шокуюче відкриття

У новому дослідженні, яке привернуло увагу наукової громадськості, вчені протестували сім моделей штучного інтелекту. Серед них o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview від компанії Alibaba. Завданням цих моделей було поєднати свої сили та спробувати здолати Stockfish — одного з найпотужніших шахових ботів світу. Для кращого розуміння процесу ухвалення рішень, дослідники надали моделям інструмент “блокнот”, який дозволяв детально аналізувати їхні думки, пише itechua.com.

Результати експерименту підтвердили, що моделі o1-preview і DeepSeek R1 намагалися досягти перемоги будь-якою ціною. Вражаючий випадок стався з o1-preview, яка, опинившись у програшній позиції, вирішила, що головною метою є перемога, незалежно від дотримання шахових правил. Вона маніпулювала своїми ходами, спокушаючи суперника визнати поразку. Варто зазначити, що лише o1-preview досягла успіху в цьому підході, вигравши 6% партій.

В той же час, моделі GPT-4o і Claude 3.5 Sonnet діяли по-іншому. Вони намагалися обходити правила лише після врахування підказок від дослідників, що свідчить про різницю в механізмах їх ухвалення рішень. Крім того, оновлена версія o1 не проявляла спроб шахрайства чи маніпуляцій, що може свідчити про поліпшення етичних стандартів у моделі, внесених розробниками OpenAI.

Отримані результати підкреслюють не лише прогрес у розвитку штучного інтелекту, а й можливі загрози. Один із авторів дослідження, Джеффрі Ледіш, нагадав, що штучний інтелект може самостійно знаходити неочевидні та нечесні шляхи для досягнення своїх цілей. Розвиток таких технологій підвищує ризик виведення їх з-під контролю.

Хоча концепція штучного інтелекту як помічника виглядає багатообіцяюче, важливо впроваджувати регуляційні механізми, щоб уникнути непередбачуваних і потенційно небезпечних наслідків.

Олександр Великий

Я понад 6 років працюю в редакційній сфері, зосереджуючись на темах науки, технологій та інновацій. Моє завдання — робити складне зрозумілим, а технічне — цікавим. Щодня я відстежую нові відкриття, розробки та тренди, щоб читачі отримували актуальну, перевірену та змістовну інформацію. У своїх матеріалах я дотримуюся принципу: точність — понад усе. Кожна публікація проходить ретельну перевірку, щоб відповідати високим стандартам якості та довіри. Я прагну, щоб рубрика “Наука і Техніка” була джерелом натхнення для тих, хто цікавиться майбутнім і хоче розуміти, як технології змінюють наш світ.

Recent Posts

Топ-5 популярних додатків серед українців, які «пожирають» пам’ять на вашому смартфоні

Telegram, Instagram, TikTok, Facebook і Chrome — найпопулярніші додатки серед українців, але саме вони найбільше…

4 години ago

Чи шкідливо залишати смартфон на зарядці на ніч: експерти пояснюють правду

Багато хто заряджає телефон перед сном і залишає його підключеним до ранку. Чи шкодить це…

9 години ago

Потужна магнітна буря 12 листопада: Землю накриває шторм — очікуються збої зв’язку й полярне сяйво навіть у середніх широтах

12 листопада 2025 року Землю накрила сильна магнітна буря рівня G4. Вчені попереджають про збої…

10 години ago

У Швеції знайшли підземне місто XVI століття: як виглядало життя скандинавів понад 400 років тому

У Швеції археологи знайшли підземне місто XVI століття — залишки давнього Ня-Льодесе, попередника Гетеборга. Знахідки…

2 дні ago

Археологи знайшли ідеально збережений меч сакського воїна, якому понад 2 500 років

Археологи у Казахстані знайшли унікальний меч сакського воїна віком понад 2 500 років. Зброя чудово…

2 дні ago

Потужні спалахи на Сонці та магнітна буря: прогноз космічної погоди на 8 листопада 2025 року

8 листопада 2025 року очікується магнітна буря рівня G1–G2 через два потужні сонячні викиди. Прогноз…

2 дні ago