人工智能版权之争不断涌现，如何织就数据版权保护网？

首页企业动态媒体报道

2023-06-19 15:09:57

从文字、绘画到音乐，当下，突飞猛进的AIGC（人工智能生成内容）技术正在全球范围内改变着创作方式，国内的人工智能产业也呈现百舸争流的迅猛态势，与此同时，人工智能版权之争不断涌现，相关数据侵权问题备受关注。在国内，学界、商界、司法界以及第三方机构有关人工智能和版权的讨论也正在进行。近日，中国版权协会在京主办的人工智能生成内容版权问题研讨会上，中文在线集团股份有限公司（下称中文在线）、同方知网数字出版技术股份有限公司等26家单位共同发布了国内首份有关AIGC数据版权的倡议书，呼吁多方合作共建AIGC版权保护生态。

　　发出保护倡议

　　AI技术发展一日千里，而很多数据权利的界定仍处于模糊地带，如近期出现的“AI孙燕姿”，在音乐界引发广泛争议。

　　“目前，大模型训练数据绝大多数是从互联网上抓取的，其中有些数据受到版权保护，但在使用中对此并未加以区分。”在中文在线董事长兼总裁童之磊看来，随着各项相关法规不断细化完善，保护正版数据所有者权益的呼声渐长，AIGC研发主体可能面临两难选择：仅使用免费的合规数据训练，可能因数据多样性不足、数据质量不高导致模型效果欠佳，甚至可能因数据安全性不足，面临模型抵御攻击性差、隐私信息暴露等风险；而要提高模型精度和AIGC产品竞争力，可能面临侵权风险或陷入繁复的授权流程。

　　在全球AIGC数据侵权纠纷频发、国内《生成式人工智能服务管理办法（征求意见稿）》发布的大背景下，合理使用正版数据是大势所趋。论坛上，中文在线、同方知网数字出版技术股份有限公司、中国工人出版社等26家单位联合发布倡议书，意在通过倡议形成行业共识，推动生成式人工智能产业健康、高质量发展，共建繁荣可持续的人工智能产业生态。

　　从内容上看，倡议书面向AIGC领域专家、学者及AIGC从业机构，分别从深化版权问题研究、版权赋能产业发展、避免侵权、引导AI生成内容的合理使用、提升版权保护意识、优化内容授权渠道这6个方面提出了倡议，覆盖了从AIGC模型研发到产品使用，从版权问题理论研究到数据流通实践的各个环节。“发布这份倡议书，一方面是为了唤醒国内AI企业关于大模型训练数据的版权意识，另一方面是为AIGC研发者规避版权争议提供方向性指引。”童之磊表示。

　　共探化解之道

　　其实，实现人工智能技术和产业发展与数据版权保护之间并不矛盾。倡议书指出，保护版权能够为人工智能学习模型提供可靠、稳定、安全的内容来源，使模型效果更加显著。同时，倡议书提出了一个切实可行的解决方案：各方积极努力，在模型训练者与内容提供者之间搭建便利、有序的内容授权渠道。模型训练者在使用包含版权内容的数据时，应确保数据安全，防止数据滥用和泄露，由此规范行为，优化内容授权渠道。

　　倡议书给出了数据版权保护的大方向，但在实操层面，如何聚合各方力量，共建AIGC时代版权保护新生态，仍然需要在实践中持续摸索。

　　探索数字时代的版权保护之道，很多企业已经积累了丰富的经验，中文在线就是其中一家。面对AI时代的版权挑战，童之磊认为，既然是以技术为因，就应该以技术去应对。因此，中文在线以自主研发的创珍链作为底层技术，支撑版权流转所有阶段，同时以人工智能为基础，打造了一站式版权监测和维权平台，并以大数据为基础，构建了版权价值评估体系，建设了版权价值数据库。此外，还通过开放合作，积极推进版权保护生态的建立。

　　化解AIGC带来的版权保护挑战，各界都在积极行动。今年4月11日，《生成式人工智能服务管理办法（征求意见稿）》发布，向社会公开征求意见。“数字时代，法律的底层逻辑发生了变化，技术权利已经变成了一项独立的权利，而客观存在的数据权利如何归类、如何运用，要随着应用实践不断提炼。”中国法学会副会长甘藏春在研讨会上提出。

　　AIGC带来的全球化变革浪潮与版权保护新挑战，亟待各界携手共进退。“需要团结更多前沿的技术公司以及内容产业、法律界和版权界的同仁，各方携手保护数字版权，开启AIGC版权保护的新格局。”童之磊呼吁。（本报记者窦新颖）

（文章来源：中国知识产权报原标题：26家单位联合发布人工智能生成内容数据版权保护倡议书——织就数据版权保护网）

服务热线：010-51667567 / 传真：010-85195550