ИИ-модель, обученная на тысячах страниц Википедии, составила список из 100 технологий, которые быстрее всего набирают обороты в науке и промышленности — и сделала это без каких-либо экспертных заключений.

Австралийская компания League of Scholars опубликовала рейтинг Momentum 100, в котором лидируют обучение с подкреплением, блокчейн и 3D-печать. Это первая попытка заменить традиционные экспертные группы чистым анализом данных — и, по словам исследователей, повторять ее планируют ежегодно.
Как создавалась модель
В основе рейтинга лежит открытый набор данных Cosmos 1.0, опубликованный в журнале Scientific Data. Команда использовала языковую модель Wikipedia2Vec, которая преобразует статьи Википедии в числовые векторы — так называемые эмбединги. Они фиксируют не только содержание статьи, но и логику гиперссылок между материалами.
Отправной точкой стала одна статья — «Список появляющихся технологий». Из нее алгоритм развернул сеть из почти 55 000 связанных страниц, отфильтровал их до более чем 23 000 технологий и концепций, а затем оценил каждую по нескольким показателям — в частности, по возрасту технологии и динамике просмотра страниц во времени.

Почему лидирует обучение с покреплением знаний
Первое место заняло обучение с подкреплением (reinforcement learning) — подход, при котором система учится методом проб и ошибок, получая «вознаграждение» за правильные решения.
Именно этот метод лежит в основе ИИ, который побеждает людей в шахматах, го и японском сеги, а также используется при разработке лекарств и управлении дронами. Его универсальность — способность принимать последовательные решения в сложной, меняющейся среде — и обеспечила ему лидерство.
Фактически, алгоритм математически воспроизводит естественные механизмы обучения: успешные действия закрепляются положительным стимулом, неудачные — отсеиваются. Примерно так домашние питомцы усваивают команды в обмен на лакомство.

Блокчейн за пределами криптовалют
Второе место блокчейна отражает более широкий исследовательский интерес, выходящий далеко за пределы криптовалютного происхождения технологии. Среди наиболее цитируемых публикаций по этой теме — работа о роевом обучении (swarm learning), методе, позволяющем больницам и лабораториям совместно обучать ИИ на медицинских данных без обмена персональной информацией пациентов.
Статья собрала более 800 цитирований. Кроме того, блокчейн используется для контроля цепочек поставок продуктов питания, проверки данных клинических испытаний и учета производства возобновляемой энергии.
Чистые данные без мнений экспертов
Большинство ежегодных рейтингов технологий — в частности, рейтингов Всемирного экономического форума, Стэнфордского университета и журнала MIT Technology Review — основываются на мнении узкого круга специалистов.
Momentum 100 сознательно избегает такого подхода. «Наша работа была продиктована идеей картографирования технологий снизу вверх — с помощью способности ИИ выявлять скрытые знания в больших сложных системах», — объясняет Пол Маккарти, соучредитель League of Scholars.
Кэтрин Айкен из Джорджтаунского университета, специализирующаяся на новых технологиях, признает: за шесть лет в этой области методы выявления перспективных направлений практически не обновлялись — слишком экспертные, слишком ручные, слишком индивидуальные. Cosmos 1.0 она назвала полезным дополнением к этой области.
Источник: nature.c