Щорічний індексний звіт Стенфордського університету про стан штучного інтелекту фіксує, що технологія розвивається швидше, ніж суспільство встигає її осмислити. Можливості систем б’ють рекорди, інвестиції злетіли до небачених висот, а інструменти безпеки й довіра громадян відстають дедалі більше.

Можливості без меж
Понад 90 % найпомітніших нових моделей у 2025 році випустила промисловість, а не академічні установи. Кілька з них уже перевершують людей у тестах рівня PhD із природничих наук і математики змагального рівня. На одному з ключових інженерних тестів результат виріс із 60 % до майже 100 % за єдиний рік.
Частка організацій, що впровадили ШІ, сягнула 88 %. Чотири з п’яти студентів університетів уже використовують генеративні системи в навчанні, й ця цифра продовжує зростати.
Розумний і безпорадний водночас
Дослідники описують так звану «нерівну межу» ШІ — стрімкий прогрес в одних завданнях і несподівані провали в інших. Система Gemini Deep Think здобула золоту медаль на Міжнародній математичній олімпіаді, змагаючись із найкращими старшокласниками світу.
Разом із тим найкраща модель правильно читає стрілковий годинник лише у 50,1 % випадків — трохи краще за випадкове вгадування. ШІ-агенти, що виконують реальні комп’ютерні завдання, зробили стрибок із 12 % до 66 % успіху, але й досі помиляються приблизно в кожній третій спробі.
Безпека за моделями не встигає
Компанії охоче звітують, на що здатні їхні моделі, але мовчать про те, наскільки вони безпечні. Кількість задокументованих інцидентів, пов’язаних із ШІ — дезінформація, упередженість алгоритмів, порушення приватності — зросла до 362 проти 233 роком раніше.
Дослідники виявили ще одну проблему: зробити модель безпечнішою не означає зробити її кращою. Часто навпаки — підвищення безпеки знижує точність відповідей, і розробникам доводиться шукати баланс між двома цілями одночасно.
Охопив світ швидше за Інтернет
Генеративні системи досягли 53 % охоплення серед населення менш ніж за три роки — швидше, ніж свого часу персональний комп’ютер чи Інтернет. Темп поширення загалом залежить від рівня доходів у країні, але деякі держави показують вищий результат, ніж можна було очікувати. Серед лідерів — Сінгапур (61 %) і ОАЕ (54 %). США посідають лише 24-те місце з показником 28,3 %.
Реальна користь від цих інструментів теж зростає — йдеться про час, гроші й зусилля, які люди економлять завдяки ШІ щодня. Дослідники оцінюють її для американських користувачів у 172 млрд доларів на рік, а сума на одну людину за останній рік зросла втричі.
Оптимізм фахівців і скептицизм суспільства
Серед фахівців галузі 73 % очікують позитивного впливу ШІ на ринок праці — серед широкої аудиторії так вважає лише кожен четвертий. Схожий розрив фіксується і в оцінках впливу на економіку та медицину. Фахівці налаштовані оптимістично, суспільство — значно стриманіше.
Окреме питання — довіра до регуляторів. США показали найнижчий серед усіх опитаних країн рівень довіри громадян до власного уряду в питанні регулювання ШІ — лише 31 %. Євросоюз наразі сприймається світом як надійніший регулятор, ніж США або Китай.
Джерело: hai.stanford.edu