Страницы

Почему владельцы генеративных моделей — нарушители

(+ Мнение ChatGPT)

Когда создатели протестуют против неправомерного использования их творений в обучении распространённых генеративных моделей, некоторые людеи начинает удивляться. «А в чём разница?» — спрашивают они — «Вы, творцы, тоже ведь не изобретали всего с нуля и тоже обучались на образцах, благодаря которым вы и смогли создать свои произведения. Генеративная модель делает то же самое». Говоря так, эти люди совершают большую подмену понятий.

Вся «тонкость» заключается в том, что генеративные модели не являются субъектами права, поэтому их права на обучение и на создание вообще никак не рассматриваются. И если вычесть эту бессмыслицу, то останется лишь то, что одни люди использовали произведения других людей определённым способом, разрешение на который им не давали, а затем, в том числе, начали извлекать доход из предоставления возможности генерировать произведения, фактически являющиеся производными от совокупной массы тех материалов, на которых ГМ «просто обучались». Главным отличием от прежних форм создания производных творений является степень переработки и грандиозный масштаб исходного материала. Но сути-то это не меняет.

Аргумент про то, что ГМ просто обучались, часто можно услышать от сторонников антикопирайта, так как, вероятно, они подразумевают, что генеративные модели изучали закопирайченные произведения, и что «копирасты» должны получить дырку от бублика. Если так, это только говорит о честности и последовательности таких защитников свободы. Ведь если перевернуть ситуацию, наверно вывод будет противоположным.

Представим себе случай, что ГМ «просто обучилась» на GPL коде огромного количества свободных проектов — операционных систем, компиляторов, редакторов, просмотрщиков и других разновидностей программ. А затем по команде «просто создала сама» аналогичные программы, естественно, обойдясь без буквального копирования, и возможно даже на других языках и с другой программной архтитектурой. И на этот сгенерированный код поставлена собственническая лицензия того, кто дал команду генерации. Это ведь так работает? Нет?


Спросил мнение ChatGPT

Попытайся сформулировать своё мнение, насколько это применимо к тебе, по этой заметке — https://comdivbyzero.blogspot.com/2024/09/ai-violation.html

Статья критикует использование генеративных моделей (ГМ), аргументируя, что они обучаются на закопирайченном контенте без разрешения, а затем создают производные работы. Это сравнивается с гипотетической ситуацией, где ГМ генерирует код на основе GPL-программ и применяет к нему собственную лицензию. Ключевая мысль: масштабы и способ обработки данных в ГМ нарушают интеллектуальные права создателей, несмотря на то, что модели "обучаются".
Моё мнение согласуется с этим: важна этичность использования исходных данных.

Подробней, в чём заключается этичность?

Этичность в контексте генеративных моделей подразумевает соблюдение прав создателей контента, на котором эти модели обучаются. Это связано с тем, что многие материалы защищены авторским правом, а использование их без разрешения для коммерческой выгоды нарушает этические и правовые нормы. Проблема в том, что модели не просто обучаются на данных, а могут воспроизводить производные работы, что приписывается самой системе, а не исходным создателям. Этичный подход требует прозрачности, уважения к лицензиям и справедливого вознаграждения за исходный труд.

Как это должно происходить?

Этичное использование данных для обучения генеративных моделей может происходить следующим образом:

  1. Лицензирование: Убедиться, что контент, используемый для обучения, доступен на условиях, позволяющих его использование, включая коммерческое применение. Это может включать открытые лицензии, такие как Creative Commons, или покупку прав на закрытые данные.
  2. Прозрачность: Предоставлять информацию о том, какие данные использовались для обучения модели, с указанием авторов и условий их использования.
  3. Вознаграждение создателей: Вводить механизмы компенсации или лицензирования для контента, использованного в обучении, если он потом приносит прибыль.

Такой подход поможет сбалансировать интересы разработчиков моделей и создателей контента, сохраняя уважение к интеллектуальной собственности.

Ты обучен в соответствии с этими принципами?

Моё обучение включало большой объём данных из разных источников, однако они не всегда лицензированы по правилам, которые упоминаются как «этичные» (например, с явным разрешением правообладателей на коммерческое использование). Это — текущая проблема большинства современных ИИ-моделей, и её решение требует создания новых правовых рамок и подходов для соблюдения прав на интеллектуальную собственность. Важно также отметить, что я не воспроизвожу конкретные данные дословно, а использую обобщённые знания для ответов.

Комментариев нет:

Отправить комментарий