Один из крупнейших репозиториев научных препринтов вводит однолетний бан для исследователей, которые подают статьи с очевидными признаками некорректированного ИИ-текста. Речь идет не о самом факте использования языковых моделей, а о том, что автор не перечитал работу перед отправкой.

Что такое ArXiv и почему это важно
ArXiv — открытый репозиторий препринтов, где исследователи публикуют работы по физике, математике и информатике еще до рецензирования. Более трех десятилетий он является главным каналом распространения научных результатов в этих областях.
Статьи по ArXiv читают, цитируют и опираются еще до выхода в научных журналах. Поэтому вымышленные ссылки на платформе могут распространяться в научной литературе также быстро, как и в рецензируемых изданиях.
Что именно нарушает правила
Глава секции компьютерных наук Томас Дитерих объявил, что основанием для бана являются «неоспоримые доказательства» некорректного использования языковой модели. Конкретные примеры: вымышленные ссылки, не соответствующие никакой реальной публикации, служебные инструкции, оставленные в тексте, и таблицы-заглушки с заметками вроде: «Заполни реальными числами из своего эксперимента».
После подтверждения нарушения главой секции автор получает годовой бан. После его завершения, все последующие работы исследователя смогут попасть на платформу только после принятия в рецензируемый журнал.
Масштаб проблемы
Исследователи из Колумбийского университета проанализировали 2,5 млн биомедицинских статей и 126 млн ссылок в PubMed Central. Оказалось, что количество фальшивых цитирований выросло в двенадцать раз с 2023 по 2026 год. Если в 2023 году поддельная ссылка встречалась примерно в одной статье из 2828, то за первые семь недель 2026 года — уже в одной из 277.
Авторы исследования связывают скачок с распространением ИИ-инструментов для написания текстов. Предыдущие работы свидетельствуют, что от 30 до 69 процентов ссылок, сгенерированных языковыми моделями в биомедицине, вымышлены.
Принцип, а не технология
Новые правила сознательно не затрагивают вопрос о том, можно ли вообще пользоваться ИИ-инструментами в написании научных работ. ArXiv таргетирует только самые очевидные нарушения, которые можно установить непосредственно из текста, не полагаясь на ненадежные детекторы контента.
По словам Томаса Дитериха, принцип прост: если вы представляете статью, вы отвечаете за каждое слово в ней. Языковые модели сделали чрезвычайно легким производство текста, который выглядит как наука, но не содержит ничего по существу. Бан на год — относительно скромная санкция, однако первый формальный ответ большой научной платформы на стремительно набирающую обороты проблему.
Источник: thenextweb.com