人工智能版权之争不断涌现,如何织就数据版权保护网?

2023-06-19 15:09:57

      从文字、绘画到音乐,当下,突飞猛进的AIGC(人工智能生成内容)技术正在全球范围内改变着创作方式,国内的人工智能产业也呈现百舸争流的迅猛态势,与此同时,人工智能版权之争不断涌现,相关数据侵权问题备受关注。在国内,学界、商界、司法界以及第三方机构有关人工智能和版权的讨论也正在进行。近日,中国版权协会在京主办的人工智能生成内容版权问题研讨会上,中文在线集团股份有限公司(下称中文在线)、同方知网数字出版技术股份有限公司等26家单位共同发布了国内首份有关AIGC数据版权的倡议书,呼吁多方合作共建AIGC版权保护生态。


  发出保护倡议


  AI技术发展一日千里,而很多数据权利的界定仍处于模糊地带,如近期出现的“AI孙燕姿”,在音乐界引发广泛争议。


  “目前,大模型训练数据绝大多数是从互联网上抓取的,其中有些数据受到版权保护,但在使用中对此并未加以区分。”在中文在线董事长兼总裁童之磊看来,随着各项相关法规不断细化完善,保护正版数据所有者权益的呼声渐长,AIGC研发主体可能面临两难选择:仅使用免费的合规数据训练,可能因数据多样性不足、数据质量不高导致模型效果欠佳,甚至可能因数据安全性不足,面临模型抵御攻击性差、隐私信息暴露等风险;而要提高模型精度和AIGC产品竞争力,可能面临侵权风险或陷入繁复的授权流程。


  在全球AIGC数据侵权纠纷频发、国内《生成式人工智能服务管理办法(征求意见稿)》发布的大背景下,合理使用正版数据是大势所趋。论坛上,中文在线、同方知网数字出版技术股份有限公司、中国工人出版社等26家单位联合发布倡议书,意在通过倡议形成行业共识,推动生成式人工智能产业健康、高质量发展,共建繁荣可持续的人工智能产业生态。


  从内容上看,倡议书面向AIGC领域专家、学者及AIGC从业机构,分别从深化版权问题研究、版权赋能产业发展、避免侵权、引导AI生成内容的合理使用、提升版权保护意识、优化内容授权渠道这6个方面提出了倡议,覆盖了从AIGC模型研发到产品使用,从版权问题理论研究到数据流通实践的各个环节。“发布这份倡议书,一方面是为了唤醒国内AI企业关于大模型训练数据的版权意识,另一方面是为AIGC研发者规避版权争议提供方向性指引。”童之磊表示。


  共探化解之道


  其实,实现人工智能技术和产业发展与数据版权保护之间并不矛盾。倡议书指出,保护版权能够为人工智能学习模型提供可靠、稳定、安全的内容来源,使模型效果更加显著。同时,倡议书提出了一个切实可行的解决方案:各方积极努力,在模型训练者与内容提供者之间搭建便利、有序的内容授权渠道。模型训练者在使用包含版权内容的数据时,应确保数据安全,防止数据滥用和泄露,由此规范行为,优化内容授权渠道。


  倡议书给出了数据版权保护的大方向,但在实操层面,如何聚合各方力量,共建AIGC时代版权保护新生态,仍然需要在实践中持续摸索。


  探索数字时代的版权保护之道,很多企业已经积累了丰富的经验,中文在线就是其中一家。面对AI时代的版权挑战,童之磊认为,既然是以技术为因,就应该以技术去应对。因此,中文在线以自主研发的创珍链作为底层技术,支撑版权流转所有阶段,同时以人工智能为基础,打造了一站式版权监测和维权平台,并以大数据为基础,构建了版权价值评估体系,建设了版权价值数据库。此外,还通过开放合作,积极推进版权保护生态的建立。


  化解AIGC带来的版权保护挑战,各界都在积极行动。今年4月11日,《生成式人工智能服务管理办法(征求意见稿)》发布,向社会公开征求意见。“数字时代,法律的底层逻辑发生了变化,技术权利已经变成了一项独立的权利,而客观存在的数据权利如何归类、如何运用,要随着应用实践不断提炼。”中国法学会副会长甘藏春在研讨会上提出。


  AIGC带来的全球化变革浪潮与版权保护新挑战,亟待各界携手共进退。“需要团结更多前沿的技术公司以及内容产业、法律界和版权界的同仁,各方携手保护数字版权,开启AIGC版权保护的新格局。”童之磊呼吁。(本报记者 窦新颖)



(文章来源:中国知识产权报 原标题:26家单位联合发布人工智能生成内容数据版权保护倡议书——织就数据版权保护网)