Судебные разбирательства OpenAI с New York Times из-за данных для обучения моделей искусственного интеллекта, возможно, все еще назревают. Но OpenAI продвигается по сделкам с другими издателями, включая некоторые из крупнейших новостных издательств Франции и Испании.
OpenAI недавно объявила, что подписала контракты с Le Monde и Prisa Media на предоставление новостного контента на французском и испанском языках чат-боту OpenAI ChatGPT. В сообщении в блоге OpenAI говорится, что партнерство предоставит пользователям ChatGPT информацию о текущих мероприятиях организаций — от таких брендов, как El País, Cinco Días, As и El Huffpost — там, где это имеет смысл, а также внесет вклад в постоянно растущий объем обучающих данных OpenAI.
Сколько OpenAI платит каждому? Ну, это не говорится — по крайней мере, публично. Но мы можем оценить.
В январе появилась информация о том, что OpenAI предлагает издателям от 1 до 5 миллионов долларов в год за доступ к архивам для обучения своих моделей GenAI. Что касается лицензирования статей — при условии, что информация, представленная в отчете, точна и эти цифры с тех пор не изменились, — OpenAI тратит от 4 до 20 миллионов долларов в год на новости.
Возможно, это сущие гроши для OpenAI, чей военный бюджет составляет более 11 миллиардов долларов, а годовой доход недавно превысил 2 миллиарда долларов (по данным Financial Times). Но, как недавно предположил Хантер Уолк, партнер Homebrew и соучредитель Screendoor, это достаточно существенно, чтобы потенциально вытеснить конкурентов с ИИ, также добивающихся лицензионных соглашений.
Вопрос о том, существует ли сегодня барьер для входа, остается спорным. Многие — если не большинство — поставщики ИИ решили рискнуть навлечь на себя гнев владельцев интеллектуальной собственности, решив не лицензировать данные, на основе которых они обучают модели ИИ. Есть свидетельства того, что платформа для создания произведений искусства Midjourney, например, тренируется на кадрах фильмов Disney, а Midjourney не имеет никакого отношения к Disney.
Более сложный вопрос, над которым приходится ломать голову, заключается в следующем: должно ли лицензирование быть просто затратами на ведение бизнеса и эксперименты в области искусственного интеллекта?
Уолк бы с этим не поспорил. Он выступает за введенную регулирующими органами “безопасную гавань”, которая защитила бы любого поставщика искусственного интеллекта — а также небольшие стартапы и исследователей — от юридической ответственности до тех пор, пока они соблюдают определенные стандарты прозрачности и этики.
Уолк: “Интересно, что Великобритания недавно попыталась кодифицировать что-то в этом роде, освободив использование текста и интеллектуального анализа данных для обучения ИИ из соображений авторского права до тех пор, пока это делается в исследовательских целях. Но эти усилия в конечном итоге провалились. Лично я не уверен, что зашел бы так далеко, чтобы согласиться с его предложением о “безопасной гавани”, учитывая влияние, которое ИИ угрожает оказать на и без того дестабилизированную новостную индустрию. Недавняя модель, разработанная The Atlantic, показала, что если бы поисковая система, подобная Google, интегрировала искусственный интеллект в поиск, она отвечала бы на запрос пользователя в 75% случаев, не требуя перехода по ссылке на свой веб-сайт. Но, возможно, здесь есть место для компромиссов.
Издателям следует платить — и платить справедливо. Однако, разве нет результата, при котором им платят, а претенденты на должности в области искусственного интеллекта — а также ученые — получают доступ к тем же данным, что и эти сотрудники? Я должен так думать. Гранты — это один из способов. Другое дело — более крупные чеки VC.
Я не могу сказать, что у меня есть решение, особенно учитывая, что судам еще предстоит решить, защищает ли добросовестное использование ИИ — и в какой степени — от претензий по авторским правам. Но нам жизненно важно разобраться в этих вещах. В противном случае отрасль вполне может оказаться в ситуации, когда академическая “утечка мозгов” не ослабевает, и лишь несколько мощных компаний имеют доступ к обширным наборам ценных учебных пособий.”