Суд северного округа Калифорнии постановил, что использование текстов для обучения нейросетей не является нарушением смежных авторских прав (copyright) и попадает под легальное использование (fair use). Но сделал интересную оговорку:
Users interacted only with the Claude service, which placed additional software between the user and the underlying LLM to ensure that no infringing output ever reached the users. This was akin to the limits Google imposed on how many snippets of text from any one book could be seen by any one user through its Google Books service, preventing its search tool from devolving into a reading tool. (Так же суд сослался на создание превьюшек гуглом как допустимое использование.)
Иными словами, необходимо гарантировать, чтобы выхлоп нейронки не являлся копипастой оригинальных работ.
Детали: ANTHROPIC PBC создала датасет Book3. На неё подали в суд.