У лютому 2025 року компанія Anthropic запустила проєкт Claude Plays Pokémon, у рамках якого їхня новітня ШІ-модель Claude 3.7 Sonnet була залучена до гри Pokémon на платформі Game Boy. ШІ мало завдання пройти гру, керуючи персонажем. Однак, незважаючи на понад місяць тестувань, модель Claude 3.7 не змогла “перемогти” покемонів, зіштовхуючись з труднощами у проходженні гри.
Про це розповіли експерти ArsTechnica.
Цей випадок став цікавим курйозом, адже демонструє, як навіть передові ШІ-технології можуть стикатися з викликами при виконанні простих, на перший погляд, завдань.
Розробники стверджують, що нова модель краще планує, запам’ятовує цілі та адаптується до змін у грі. Однак, попри помітний прогрес, Claude все ще зазнає труднощів: він може застрявати в глухих кутах, даремно взаємодіяти з NPC або багаторазово робити одні й ті самі помилки.
Одним із головних викликів стало сприйняття візуальної інформації. Claude 3.7 Sonnet використовує текстове розуміння Pokémon і зчитує ігрові дані безпосередньо з пам’яті, але його здатності інтерпретувати піксельні зображення обмежені.
За словами розробника проєкту Девіда Херші, ШІ краще розпізнавав би елементи в грі з більш реалістичною графікою. Навігація також залишається проблемою. Claude не завжди розуміє, що будівля непрохідна, і може годинами впиратися в стіну.
Ще одна складність пов’язана з пам’яттю. Контекстне вікно моделі обмежене 200 000 токенами, і під час його заповнення ШІ намагається підсумувати накопичені знання, що іноді призводить до втрати важливих деталей.
Більше того, якщо модель робить помилку, вона може надовго зациклитися на помилкових даних, наприклад, вважаючи, що вихід із локації розташований не там, де він є насправді. Однак останні версії Claude вже демонструють зачатки самокорекції, що важливо для майбутнього розвитку ШІ, вважають експерти.
На думку розробників, розширення контексту і поліпшення обробки зображень можуть наблизити ШІ до проходження гри. Поки ж експеримент показує, що навіть передові мовні моделі, попри успіхи в аналізі тексту і плануванні, все ще стикаються з фундаментальними обмеженнями під час взаємодії зі світом. Це віддаляє їх від справжнього AGI, підкреслили аналітики.
Телескоп Джеймса Вебба зробив унікальний знімок "космічного торнадо".
Новий вид дерев-гігантів виявлений у тропічних лісах гір Удзунгва в Танзанії, що розкриває ще одну…
Чи готовий світ до iPhone без жодного роз'єму?
Crew Dragon, в межах місії Fram2, здійснить перший в історії людства пілотований політ над полюсами…
Користувачі lifecell обурені тарифами на популярну послугу.
В давнину по-особливому виділяли добрих людей, які не тримали зла, співчували та допомагали іншим.