Без экспертов: ИИ проанализировал Википедию и определил 100 самых перспективных технологий

ИИ-модель, обученная на тысячах страниц Википедии, составила список из 100 технологий, которые быстрее всего набирают обороты в науке и промышленности — и сделала это без каких-либо экспертных заключений.

Промисловий 3D-принтер під час друку деталі складної геометричної форми.
Предполагается, что 3D-печать станет одной из технологий, которые будут развиваться быстрее всего в этом году. Фото: Stenko Vladislav Vitalievich / iStock via Getty. Источник: nature.com

Австралийская компания League of Scholars опубликовала рейтинг Momentum 100, в котором лидируют обучение с подкреплением, блокчейн и 3D-печать. Это первая попытка заменить традиционные экспертные группы чистым анализом данных — и, по словам исследователей, повторять ее планируют ежегодно.

Как создавалась модель

В основе рейтинга лежит открытый набор данных Cosmos 1.0, опубликованный в журнале Scientific Data. Команда использовала языковую модель Wikipedia2Vec, которая преобразует статьи Википедии в числовые векторы — так называемые эмбединги. Они фиксируют не только содержание статьи, но и логику гиперссылок между материалами. 

Отправной точкой стала одна статья — «Список появляющихся технологий». Из нее алгоритм развернул сеть из почти 55 000 связанных страниц, отфильтровал их до более чем 23 000 технологий и концепций, а затем оценил каждую по нескольким показателям — в частности, по возрасту технологии и динамике просмотра страниц во времени.

Горизонтальна стовпчикова діаграма «Коефіцієнт зростання технологій» на фоні космічної туманності. Найвищий показник у «Навчання з підкріпленням» (0,91), найнижчий — у «Повногеномне секвенування» (0,29)
Рейтинг технологий Momentum 100 по коэффициенту их роста. Источник: League of Scholars. Interactive chart by James Bayliss and Tanner Maxwell

Почему лидирует обучение с покреплением знаний

Первое место заняло обучение с подкреплением (reinforcement learning) — подход, при котором система учится методом проб и ошибок, получая «вознаграждение» за правильные решения. 

Космос для каждого

Магазин от Universe Space Tech

№2 (177) 2020

К товару

Именно этот метод лежит в основе ИИ, который побеждает людей в шахматах, го и японском сеги, а также используется при разработке лекарств и управлении дронами. Его универсальность — способность принимать последовательные решения в сложной, меняющейся среде — и обеспечила ему лидерство.

Фактически, алгоритм математически воспроизводит естественные механизмы обучения: успешные действия закрепляются положительным стимулом, неудачные — отсеиваются. Примерно так домашние питомцы усваивают команды в обмен на лакомство.

Фотореалістичне зображення роюособаки, що сидить на траві під сонячним світлом. Перед мордою робота ширяє сяюча геометрична фігура, що символізує цифрову винагороду.
Концептуальная визуализация системы обучения моделей ИИ с помощью цифровых стимулов

Блокчейн за пределами криптовалют

Второе место блокчейна отражает более широкий исследовательский интерес, выходящий далеко за пределы криптовалютного происхождения технологии. Среди наиболее цитируемых публикаций по этой теме — работа о роевом обучении (swarm learning), методе, позволяющем больницам и лабораториям совместно обучать ИИ на медицинских данных без обмена персональной информацией пациентов. 

Статья собрала более 800 цитирований. Кроме того, блокчейн используется для контроля цепочек поставок продуктов питания, проверки данных клинических испытаний и учета производства возобновляемой энергии.

Чистые данные без мнений экспертов

Большинство ежегодных рейтингов технологий — в частности, рейтингов Всемирного экономического форума, Стэнфордского университета и журнала MIT Technology Review — основываются на мнении узкого круга специалистов. 

Momentum 100 сознательно избегает такого подхода. «Наша работа была продиктована идеей картографирования технологий снизу вверх — с помощью способности ИИ выявлять скрытые знания в больших сложных системах», — объясняет Пол Маккарти, соучредитель League of Scholars. 

Кэтрин Айкен из Джорджтаунского университета, специализирующаяся на новых технологиях, признает: за шесть лет в этой области методы выявления перспективных направлений практически не обновлялись — слишком экспертные, слишком ручные, слишком индивидуальные. Cosmos 1.0 она назвала полезным дополнением к этой области.

Источник: nature.c