Datasets de entrenamiento en la inteligencia artificial generativa: desafíos para el derecho de autor

Authors

DOI:

https://doi.org/10.20983/reij.2026.2.1

Keywords:

Datasets de entrenamiento, Derecho de autor, Inteligencia artificial generativa

Abstract

La inteligencia artificial generativa (iag) ha transformado de manera significativa los procesos de creación y producción de contenidos, al basarse en el entrenamiento de modelos con grandes volúmenes de datos que, en numerosos casos, incluyen obras protegidas por derecho de autor. El objetivo de esta investigación es analizar las implicaciones jurídicas derivadas del uso de obras protegidas por derecho de autor en los datasets de entrenamiento de la iag, con el fin de identificar las principales tensiones normativas y brechas regulatorias existentes. La metodología es de carácter cualitativo y se basa en una revisión doctrinal y normativa, complementada con una perspectiva de derecho comparado. El análisis comparado realizado permitió identificar que el uso masivo de obras protegidas en procesos de entrenamiento implica actos jurídicamente relevantes de reproducción y transformación que no encuentran una respuesta clara en el marco jurídico internacional vigente. 

Downloads

Download data is not yet available.

References

Bommasani, R., Hudson, D. A., Adeli, E., Altman, R., Arora, S., von Arx, S., Bernstein, M. S., Bohg, J., Bosselut, A., Brunskill, E., Brynjolfsson, E., Buch, V., Card, D., Castellon, R., Chatterji, N. S., Chen, A., Creel, K. A., Davis, J. Q., Demszky, D., ... Liang, P. (2021). On the opportunities and risks of foundation models. arXiv preprint arXiv:2108.07258. https://arxiv.org/abs/2108.07258

Buick, A. (2024). Copyright and AI training data—Transparency to the rescue? Journal of Intellectual Property Law & Practice, 20(3), 182-192. https://doi.org/10.1093/jiplp/jpae102

Comisión Europea. (2022). Study on copyright and artificial intelligence. Publications Office of the European Union.

-----. (2025). General-purpose AI Code of Practice. Publications Office of the European Union. https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai

Convenio de Berna para la Protección de las Obras Literarias y Artísticas (1886). https://www.wipo.int/treaties/es/ip/berne/

Creemers, R. (2025). The regulation of generative AI in China. Social Science Research Network. https://ssrn.com/abstract=5228697

Cyberspace Administration of China (CAC). (2023). Interim Measures for the Management of Generative Artificial Intelligence Services. Cyberspace Administration of China.

De la Parra, E. (2015). Derechos humanos y derechos de autor. Las restricciones al derecho de explotación (Universidad Nacional Autónoma de México e Instituto de Investigaciones Jurídicas, Eds.; 2ª ed.).

Directiva 2001/29/CE del Parlamento Europeo y del Consejo, de 22 de mayo de 2001, sobre la armonización de determinados aspectos de los derechos de autor y derechos afines en la sociedad de la información.

https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:32001L0029

Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital, y por la que se modifican las Directivas 96/9/CE y 2001/29/CE.

https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:32019L0790

Gervais, D. J. (2020). The machine as author. Iowa Law Review, 105(5), 2053-2106.

Ginsburg, J. C., & Budiardjo, L. (2019). Authors and machines. Berkeley Technology Law Journal, 34, 343-448.

Henderson, P., Li, X., Jurafsky, D., Hashimoto, T., Lemley, M. A., & Liang, P. (2023). Foundation models and fair use. Journal of Machine Learning Research, 24, 400, 1-79. https://arxiv.org/abs/2303.15715

Kretschmer, M., Margoni, T., & Oruç, P. (2024). Copyright law and the lifecycle of machine learning models. IIC — International Review of Intellectual Property and Competition Law, 55(1), 110-138. https://doi.org/10.1007/s40319-023-01419-3

Lipszyc, D. (1993). Derecho de autor y derechos conexos (Centro Regional para el Fomento del Libro en América Latina y el Caribe [Cerlalc], Ed.).

Lucchi, N. (2025). Generative AI and copyright: Training, creation and regulation (Study No. PE 774.095). Policy Department for Justice, Civil Liberties and Institutional Affairs, European Parliament. https://www.europarl.europa.eu/RegData/etudes/STUD/2025/774095/IUST_STU(2025)774095_EN.pdf

Mitchell, T. (2025). Trust and transparency in artificial intelligence. Philosophy & Technology, 38(3), 1-30. https://doi.org/10.1007/s13347-025-00916-2

Pasetti, M., Santos, J. W., Corrêa, N. K., De Oliveira, N., & Barbosa, C. P. (2025). Technical, legal, and ethical challenges of generative artificial intelligence: An analysis of the governance of training data and copyrights. Discover Artificial Intelligence, 5, Article 193. https://doi.org/10.1007/s44163-025-00379-6

Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo, de 13 de junio de 2024, por el que se establecen normas armonizadas en materia de inteligencia artificial (Acta Legislativa: Artificial Intelligence Act). Diario Oficial de la Unión Europea, L 1689, 12.7.2024. https://eur-lex.europa.eu/eli/reg/2024/1689/oj

Russell, S., & Norvig, P. (2021). Artificial intelligence: A modern approach (4th Ed.). Pearson.

Samuelson, P. (2023). Generative AI meets copyright. Science, 381(6654), 158-161. https://doi.org/10.1126/science.adi0656

Sengar, S. S., Hasan, A. B., Kumar, S., & Carroll, F. (2024). Generative artificial intelligence: A systematic review and applications. Multimedia Tools and Applications, 84(21), 23661-23700. https://doi.org/10.1007/s11042-024-20016-1

Tribunal de Justicia de la Unión Europea. (2009). Infopaq International A/S v. Danske Dagblades Forening (Asunto C-5/08). ECLI:EU:C:2009:465. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:62008CJ0005

United States Copyright Office. (2023). Copyright registration guidance: Works containing AI-generated material. U.S. Copyright Office.

-----. (2025). Copyright and artificial intelligence, Part 3: Generative AI training (pre-publication version). U.S. Copyright Office. https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf

Ziaja, G. M. (2024) The text and data mining opt-out in Article 4(3) CDSMD: Adequate veto right for rightholders or a suffocating blanket for European artificial intelligence innovations? Journal of Intellectual Property Law and Practice, 19(5), 453-459.

Published

2026-06-02