Как новые правила могут защитить интернет от AI-скраперов

Искусственный интеллект вызывает серьёзную тревогу у пользователей по всему миру. Основные опасения связаны с распространением дезинформации, мошенничеством, потенциальной потерей рабочих мест и использованием интеллектуальной собственности без согласия авторов.

Компании, разрабатывающие ИИ, часто обучают свои модели на данных, полученных путём автоматического сбора информации с различных веб-сайтов. Этот контент может включать статьи, научные работы и публикации в социальных сетях.

Раньше подобные практики существовали в своеобразном нейтральном статусе. Они были необходимы для функционирования поисковых систем и соответствовали идеологии открытого интернета. Однако с развитием генеративного ИИ ситуация изменилась.

Новые реалии цифрового пространства

Многие новостные издания начали блокировать сборщиков данных. Авторы контента ограничивают свою активность или покидают некоторые платформы. Установление барьеров в открытой сети может негативно сказаться на демократических процессах, научных инновациях и творческих сообществах.

Действующие исключения в законах об авторском праве, такие как добросовестное использование в исследовательских целях, были созданы задолго до появления публичного генеративного ИИ и сегодня требуют пересмотра.

В ответ на эти вызовы некоммерческая организация Creative Commons предложила новую добровольную систему — CC Signals.

Принципы работы системы CC Signals

Эта структура позволяет создателям контента определять, могут ли их материалы использоваться машинами и на каких условиях. Система основана на принципах согласия, компенсации и указания авторства.

По сути, CC Signals позволяют владельцу контента прикреплять к своим материалам машиночитаемые инструкции. Эти инструкции определяют допустимые способы использования и сопутствующие требования.

Предложение появляется в момент, напоминающий ранние дни интернета, когда нормы автоматизированного доступа к данным формировались на практике, а не на законодательном уровне.

Преимущества и недостатки подхода

Система предоставляет создателям больше контроля и гибкости по сравнению с текущей бинарной моделью «разрешено/запрещено». Она также может повлиять на качество данных, доступных для обучения ИИ, что напрямую связано с эффективностью и объективностью алгоритмов.

Кроме того, система может помочь небольшим авторам, которые не обладают достаточными ресурсами для переговоров с технологическими гигантами, но хотят получать вознаграждение или признание за свой труд.

Основная сложность заключается в практической реализации — как рассчитать и обеспечить выполнение условий по компенсации или иной поддержке, требуемой некоторыми сигналами. Это серьёзная проблема, характерная и для других отраслевых предложений по коллективному лицензированию контента для ИИ.

Перспективы развития

Creative Commons позиционирует CC Signals не столько как юридический инструмент, сколько как попытку установить «правила поведения для машин». Это удачная аналогия.

Юридические и практические препятствия на пути создания эффективной системы управления авторскими правами для ИИ огромны. Однако важно быть открытыми к новым идеям и структурам, которые ставят во главу угла уважение и признание авторов, не блокируя при этом важные технологические разработки.

CC Signals — неидеальная, но важная отправная точка. Остаётся надеяться, что появятся и другие конструктивные решения.