ШІ-модель, навчена на тисячах сторінок Вікіпедії, склала список 100 технологій, які найшвидше набирають обертів у науці та індустрії — і зробила це без жодної експертної думки в основі.

Австралійська компанія League of Scholars опублікувала рейтинг Momentum 100, його очолюють навчання з підкріпленням, блокчейн і 3D-друк. Це перша спроба замінити традиційні експертні панелі чистим аналізом даних — і, за словами дослідників, повторювати її планують щороку.
Як будувалася модель
В основі рейтингу — відкритий набір даних Cosmos 1.0, опублікований у журналі Scientific Data. Команда використала мовну модель Wikipedia2Vec, яка перетворює вікіпедійні статті на числові вектори — так звані ембединги. Вони фіксують не лише зміст статті, а й логіку гіперпосилань між матеріалами.
Відправною точкою стала одна стаття — «Список технологій, що з’являються». З неї алгоритм розгорнув мережу з майже 55 000 пов’язаних сторінок, відфільтрував їх до понад 23 000 технологій і концепцій, а потім оцінив кожну за кількома індексами — зокрема, за віком технології та динамікою перегляду сторінок у часі.

Чому лідирує навчання з підкріпленням
Перше місце дісталося навчанню з підкріпленням (reinforcement learning) — підходу, при якому система вчиться методом спроб і помилок, отримуючи «винагороду» за правильні рішення.
Саме цей метод лежить в основі ШІ, що перемагає людей у шахах, го та японських сьоґі, а також використовується в розробці ліків і керуванні дронами. Його універсальність — здатність приймати послідовні рішення у складному середовищі, що змінюється — і забезпечила йому першість.
Фактично, алгоритм математично відтворює природні механізми навчання: успішні дії закріплюються позитивним стимулом, невдалі — відсіюються. Приблизно так домашні улюбленці засвоюють команди за частування.

Блокчейн за межами криптовалют
Друге місце блокчейну відображає ширший дослідницький інтерес, що виходить далеко за межі криптовалютного походження технології. Серед найцитованіших публікацій у цій темі — робота про роєве навчання (swarm learning), метод, що дозволяє лікарням і лабораторіям спільно тренувати ШІ на медичних даних без обміну персональною інформацією пацієнтів.
Стаття зібрала понад 800 цитувань. Також блокчейн застосовується для контролю харчових ланцюжків постачання, перевірки даних клінічних випробувань і обліку виробництва відновлюваної енергії.
Чисті дані без думки експертів
Більшість щорічних рейтингів технологій — зокрема від Всесвітнього економічного форуму, Стенфордського університету та журналу MIT Technology Review — спираються на думку вузького кола фахівців.
Momentum 100 свідомо уникає цього підходу. «Наша робота була мотивована ідеєю картографування технологій знизу вгору — за допомогою здатності ШІ виявляти приховані знання у великих складних системах», — пояснює Пол Маккарті, співзасновник League of Scholars.
Кетрін Айкен з Джорджтаунського університету, яка спеціалізується на технологіях, що з’являються, визнає: за шість років у цій галузі методи виявлення перспективних напрямів практично не оновлювались — надто експертні, надто ручні, надто індивідуальні. Cosmos 1.0 вона назвала корисним доповненням до поля.
Джерело: nature.com