Datasets de entrenamiento en la inteligencia artificial generativa: desafíos para el derecho de autor
DOI:
https://doi.org/10.20983/reij.2026.2.1Keywords:
Datasets de entrenamiento, Derecho de autor, Inteligencia artificial generativaAbstract
La inteligencia artificial generativa (iag) ha transformado de manera significativa los procesos de creación y producción de contenidos, al basarse en el entrenamiento de modelos con grandes volúmenes de datos que, en numerosos casos, incluyen obras protegidas por derecho de autor. El objetivo de esta investigación es analizar las implicaciones jurídicas derivadas del uso de obras protegidas por derecho de autor en los datasets de entrenamiento de la iag, con el fin de identificar las principales tensiones normativas y brechas regulatorias existentes. La metodología es de carácter cualitativo y se basa en una revisión doctrinal y normativa, complementada con una perspectiva de derecho comparado. El análisis comparado realizado permitió identificar que el uso masivo de obras protegidas en procesos de entrenamiento implica actos jurídicamente relevantes de reproducción y transformación que no encuentran una respuesta clara en el marco jurídico internacional vigente.
Downloads
References
Bommasani, R., Hudson, D. A., Adeli, E., Altman, R., Arora, S., von Arx, S., Bernstein, M. S., Bohg, J., Bosselut, A., Brunskill, E., Brynjolfsson, E., Buch, V., Card, D., Castellon, R., Chatterji, N. S., Chen, A., Creel, K. A., Davis, J. Q., Demszky, D., ... Liang, P. (2021). On the opportunities and risks of foundation models. arXiv preprint arXiv:2108.07258. https://arxiv.org/abs/2108.07258
Buick, A. (2024). Copyright and AI training data—Transparency to the rescue? Journal of Intellectual Property Law & Practice, 20(3), 182-192. https://doi.org/10.1093/jiplp/jpae102
Comisión Europea. (2022). Study on copyright and artificial intelligence. Publications Office of the European Union.
-----. (2025). General-purpose AI Code of Practice. Publications Office of the European Union. https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai
Convenio de Berna para la Protección de las Obras Literarias y Artísticas (1886). https://www.wipo.int/treaties/es/ip/berne/
Creemers, R. (2025). The regulation of generative AI in China. Social Science Research Network. https://ssrn.com/abstract=5228697
Cyberspace Administration of China (CAC). (2023). Interim Measures for the Management of Generative Artificial Intelligence Services. Cyberspace Administration of China.
De la Parra, E. (2015). Derechos humanos y derechos de autor. Las restricciones al derecho de explotación (Universidad Nacional Autónoma de México e Instituto de Investigaciones Jurídicas, Eds.; 2ª ed.).
Directiva 2001/29/CE del Parlamento Europeo y del Consejo, de 22 de mayo de 2001, sobre la armonización de determinados aspectos de los derechos de autor y derechos afines en la sociedad de la información.
https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:32001L0029
Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital, y por la que se modifican las Directivas 96/9/CE y 2001/29/CE.
https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:32019L0790
Gervais, D. J. (2020). The machine as author. Iowa Law Review, 105(5), 2053-2106.
Ginsburg, J. C., & Budiardjo, L. (2019). Authors and machines. Berkeley Technology Law Journal, 34, 343-448.
Henderson, P., Li, X., Jurafsky, D., Hashimoto, T., Lemley, M. A., & Liang, P. (2023). Foundation models and fair use. Journal of Machine Learning Research, 24, 400, 1-79. https://arxiv.org/abs/2303.15715
Kretschmer, M., Margoni, T., & Oruç, P. (2024). Copyright law and the lifecycle of machine learning models. IIC — International Review of Intellectual Property and Competition Law, 55(1), 110-138. https://doi.org/10.1007/s40319-023-01419-3
Lipszyc, D. (1993). Derecho de autor y derechos conexos (Centro Regional para el Fomento del Libro en América Latina y el Caribe [Cerlalc], Ed.).
Lucchi, N. (2025). Generative AI and copyright: Training, creation and regulation (Study No. PE 774.095). Policy Department for Justice, Civil Liberties and Institutional Affairs, European Parliament. https://www.europarl.europa.eu/RegData/etudes/STUD/2025/774095/IUST_STU(2025)774095_EN.pdf
Mitchell, T. (2025). Trust and transparency in artificial intelligence. Philosophy & Technology, 38(3), 1-30. https://doi.org/10.1007/s13347-025-00916-2
Pasetti, M., Santos, J. W., Corrêa, N. K., De Oliveira, N., & Barbosa, C. P. (2025). Technical, legal, and ethical challenges of generative artificial intelligence: An analysis of the governance of training data and copyrights. Discover Artificial Intelligence, 5, Article 193. https://doi.org/10.1007/s44163-025-00379-6
Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo, de 13 de junio de 2024, por el que se establecen normas armonizadas en materia de inteligencia artificial (Acta Legislativa: Artificial Intelligence Act). Diario Oficial de la Unión Europea, L 1689, 12.7.2024. https://eur-lex.europa.eu/eli/reg/2024/1689/oj
Russell, S., & Norvig, P. (2021). Artificial intelligence: A modern approach (4th Ed.). Pearson.
Samuelson, P. (2023). Generative AI meets copyright. Science, 381(6654), 158-161. https://doi.org/10.1126/science.adi0656
Sengar, S. S., Hasan, A. B., Kumar, S., & Carroll, F. (2024). Generative artificial intelligence: A systematic review and applications. Multimedia Tools and Applications, 84(21), 23661-23700. https://doi.org/10.1007/s11042-024-20016-1
Tribunal de Justicia de la Unión Europea. (2009). Infopaq International A/S v. Danske Dagblades Forening (Asunto C-5/08). ECLI:EU:C:2009:465. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX:62008CJ0005
United States Copyright Office. (2023). Copyright registration guidance: Works containing AI-generated material. U.S. Copyright Office.
-----. (2025). Copyright and artificial intelligence, Part 3: Generative AI training (pre-publication version). U.S. Copyright Office. https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf
Ziaja, G. M. (2024) The text and data mining opt-out in Article 4(3) CDSMD: Adequate veto right for rightholders or a suffocating blanket for European artificial intelligence innovations? Journal of Intellectual Property Law and Practice, 19(5), 453-459.
Published
Issue
Section
License
Copyright (c) 2026 César Ricardo Castillo Velazco

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
El titular de los derechos de explotación de los contenidos de la Revista Especializada en Investigación Jurídica es el Autor o Autora
El licenciamiento bajo el cual se publican los contenidos es Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) por lo que se autoriza compartir, copiar y redistribuir el material en cualquier medio y formato, adaptar, remezclar, transformar y construir a partir del material para cualquier propósito, siempre y cuando no sea con fines comerciales y se cite al autor(es) original y a la fuente, proporcione la liga a la licencia Creative Commons e indique claramente si se hicieron cambios a la obra y especifique cuales fueron dichos cambios. Para más información consultar el apartado de Política de Acceso Abierto de la revista.













