ArXiv вводит однолетний бан за халатность при использовании ИИ

Один из крупнейших репозиториев научных препринтов вводит однолетний бан для исследователей, которые подают статьи с очевидными признаками некорректированного ИИ-текста. Речь идет не о самом факте использования языковых моделей, а о том, что автор не перечитал работу перед отправкой.

Стіл дослідника з науковими статтями та ноутбуком із текстом ШІ на екрані
Исследователи, которые подают статьи с некорректируемым текстом ИИ, будут получать годовой бан на ArXiv

Что такое ArXiv и почему это важно

ArXiv — открытый репозиторий препринтов, где исследователи публикуют работы по физике, математике и информатике еще до рецензирования. Более трех десятилетий он является главным каналом распространения научных результатов в этих областях.

Статьи по ArXiv читают, цитируют и опираются еще до выхода в научных журналах. Поэтому вымышленные ссылки на платформе могут распространяться в научной литературе также быстро, как и в рецензируемых изданиях.

Что именно нарушает правила

Глава секции компьютерных наук Томас Дитерих объявил, что основанием для бана являются «неоспоримые доказательства» некорректного использования языковой модели. Конкретные примеры: вымышленные ссылки, не соответствующие никакой реальной публикации, служебные инструкции, оставленные в тексте, и таблицы-заглушки с заметками вроде: «Заполни реальными числами из своего эксперимента».

Понравился контент? Подписывайся на наше сообщество и получай больше про космос Печатные журналы, события и общение в кругу космических энтузиастов Подписаться на сообщество

После подтверждения нарушения главой секции автор получает годовой бан. После его завершения, все последующие работы исследователя смогут попасть на платформу только после принятия в рецензируемый журнал.

Масштаб проблемы

Исследователи из Колумбийского университета проанализировали 2,5 млн биомедицинских статей и 126 млн ссылок в PubMed Central. Оказалось, что количество фальшивых цитирований выросло в двенадцать раз с 2023 по 2026 год. Если в 2023 году поддельная ссылка встречалась примерно в одной статье из 2828, то за первые семь недель 2026 года — уже в одной из 277.

Авторы исследования связывают скачок с распространением ИИ-инструментов для написания текстов. Предыдущие работы свидетельствуют, что от 30 до 69 процентов ссылок, сгенерированных языковыми моделями в биомедицине, вымышлены.

Принцип, а не технология

Новые правила сознательно не затрагивают вопрос о том, можно ли вообще пользоваться ИИ-инструментами в написании научных работ. ArXiv таргетирует только самые очевидные нарушения, которые можно установить непосредственно из текста, не полагаясь на ненадежные детекторы контента.

По словам Томаса Дитериха, принцип прост: если вы представляете статью, вы отвечаете за каждое слово в ней. Языковые модели сделали чрезвычайно легким производство текста, который выглядит как наука, но не содержит ничего по существу. Бан на год — относительно скромная санкция, однако первый формальный ответ большой научной платформы на стремительно набирающую обороты проблему.

Источник: thenextweb.com