У лютому 2025 року компанія Anthropic запустила проєкт Claude Plays Pokémon, у рамках якого їхня новітня ШІ-модель Claude 3.7 Sonnet була залучена до гри Pokémon на платформі Game Boy. ШІ мало завдання пройти гру, керуючи персонажем. Однак, незважаючи на понад місяць тестувань, модель Claude 3.7 не змогла “перемогти” покемонів, зіштовхуючись з труднощами у проходженні гри.
Про це розповіли експерти ArsTechnica.
Цей випадок став цікавим курйозом, адже демонструє, як навіть передові ШІ-технології можуть стикатися з викликами при виконанні простих, на перший погляд, завдань.
Розробники стверджують, що нова модель краще планує, запам’ятовує цілі та адаптується до змін у грі. Однак, попри помітний прогрес, Claude все ще зазнає труднощів: він може застрявати в глухих кутах, даремно взаємодіяти з NPC або багаторазово робити одні й ті самі помилки.
Одним із головних викликів стало сприйняття візуальної інформації. Claude 3.7 Sonnet використовує текстове розуміння Pokémon і зчитує ігрові дані безпосередньо з пам’яті, але його здатності інтерпретувати піксельні зображення обмежені.
За словами розробника проєкту Девіда Херші, ШІ краще розпізнавав би елементи в грі з більш реалістичною графікою. Навігація також залишається проблемою. Claude не завжди розуміє, що будівля непрохідна, і може годинами впиратися в стіну.
Ще одна складність пов’язана з пам’яттю. Контекстне вікно моделі обмежене 200 000 токенами, і під час його заповнення ШІ намагається підсумувати накопичені знання, що іноді призводить до втрати важливих деталей.
Більше того, якщо модель робить помилку, вона може надовго зациклитися на помилкових даних, наприклад, вважаючи, що вихід із локації розташований не там, де він є насправді. Однак останні версії Claude вже демонструють зачатки самокорекції, що важливо для майбутнього розвитку ШІ, вважають експерти.
На думку розробників, розширення контексту і поліпшення обробки зображень можуть наблизити ШІ до проходження гри. Поки ж експеримент показує, що навіть передові мовні моделі, попри успіхи в аналізі тексту і плануванні, все ще стикаються з фундаментальними обмеженнями під час взаємодії зі світом. Це віддаляє їх від справжнього AGI, підкреслили аналітики.
Telegram, Instagram, TikTok, Facebook і Chrome — найпопулярніші додатки серед українців, але саме вони найбільше…
Багато хто заряджає телефон перед сном і залишає його підключеним до ранку. Чи шкодить це…
12 листопада 2025 року Землю накрила сильна магнітна буря рівня G4. Вчені попереджають про збої…
У Швеції археологи знайшли підземне місто XVI століття — залишки давнього Ня-Льодесе, попередника Гетеборга. Знахідки…
Археологи у Казахстані знайшли унікальний меч сакського воїна віком понад 2 500 років. Зброя чудово…
8 листопада 2025 року очікується магнітна буря рівня G1–G2 через два потужні сонячні викиди. Прогноз…