фото - freepik
Дослідники з Единбурзького університету Шотландії перевірили, як нейромережі від Google, OpenAI та Anthropic розпізнають час на аналогових циферблатах. Виявилося, що у 75% випадків штучний інтелект помиляється, особливо коли годинник має римські цифри або незвичні стрілки.
Про це сказано на сайті університету.
Так, вчені перевірили, чи можуть системи штучного інтелекту, які обробляють текст і зображення, відомі як мультимодальні великі мовні моделі (MLLM), відповідати на запитання, пов’язані з часом, дивлячись на зображення годинника чи календаря.
Для експерименту було використано різні типи циферблатів:
Результати експерименту показали, що більшість мовних моделей в кращому випадку встановлювали правильне положення годинникової стрілки менш ніж у чверті випадків. А от коли на годиннику були римські цифри або стилізовані стрілки, то помилки траплялися частіше.
Найгірше ШІ справлявся з годинниками, на яких:
Отож, попри свої передові можливості в обробці тексту й зображень, сучасні нейромережі виявилися погано навченими на задачах розпізнавання часу.
Це може бути пов’язано з тим, що:
Ці результати демонструють обмеження сучасних мультимодальних моделей: хоча вони можуть генерувати тексти, аналізувати зображення та навіть розпізнавати складні шаблони, звичайний механічний годинник все ще залишається для них проблемою. Це нагадує, що штучний інтелект, хоч і здається розумним, все ще має прогалини у базовому візуальному аналізі.
Офіційно результати дослідження будуть оголошені у Сінгапурі 28 квітня 2025 року на семінарі “Міркування та планування великих мовних моделей” під час Тринадцятої міжнародної конференції з вивчення представлень (ICLR).
“Більшість людей вміють визначати час і користуватися календарями з раннього віку. Наші висновки підкреслюють значну прогалину в здатності штучного інтелекту виконувати те, що є досить базовими навичками для людей. Ці недоліки необхідно усунути, якщо системи штучного інтелекту мають бути успішно інтегровані в чутливі до часу реальні програми, такі як планування, автоматизація та допоміжні технології”, – заявили науковці.
Дізнайтеся про ключові нововведення в новому iPhone від експертів: покращення камери, продуктивності та нові функції.
Грибок Gibellula attenboroughii перетворює павуків на "зомбі", контролюючи їхню поведінку. Безпечний для людей, але вражає…
У WhatsApp з'явилася нова корисна функція, яка полегшить спілкування та покращить користувацький досвід. Дізнайтеся більше…
У селі Старуня на Івано-Франківщині виявлено унікальний активний грязьовий вулкан, який вражає своєю силою та…
Офіційно анонсовано новий Redmi Note 15 Pro+ з чіпом Snapdragon, потужною телекамерою та великою батареєю…
Експеримент МТІ показав, що використання ChatGPT може знижувати активність мислення. Студенти, які працювали без технологій,…