182-1095-8705
最新公告:NOTICE
8月1日起,国家知识产权局停征和调整部分专利收费,详情参阅资讯中心公告

专利申请

当前位置:专利申请 > 国内专利 > 专利申请 >

ChatGPT许可应用,知识产权和数据讲解,IP赋能NFT,平台与版权方介绍

专利代理 发布时间:2024-04-02 18:59:48 浏览:



今天,乐知网律师 给大家分享: ChatGPT许可应用,知识产权和数据讲解,IP赋能NFT,平台与版权方介绍。



ChatGPT许可应用,知识产权和数据怎么看?


2023年2月27日,《数字中国建设整体布局规划》(“《规划》”),《规划》指出,要全面赋能经济社会发展,推动数字技术和实体经济深度融合,在农业、工业、金融、教育、医疗、交通、能源等重点领域,加快数字技术创新应用。

AI作为支撑数字经济发展的重要基础设施,正在与各行业典型应用场景相融合,将为我国数字经济发展提供核心驱动力。

商业实践中,AI软件发挥作用的方式通常体现为AI企业将其研发的AI软件许可给使用者,以收取许可费的形式盈利。

如何合理安排AI软件许可协议中双方的权利义务,特别是知识产权和数据相关条款如何设计,在该等业务模式下至关重要。

以下,我们将基于AI软件与传统软件的区别,对AI软件许可协议中知识产权和数据条款设计所应当包含的要素进行探讨。

对于传统软件而言,软件开发者更关注的是软件的功能需求,即软件必须实现的功能。

因此,软件开发者需要通过使用各种模型对相关功能需求进行描述,数据处理等规则往往已经被事先设计确定。

而对于AI软件而言,功能需求相对并不那么重要,模型训练则十分关键,模型开发者通过使用大量的数据对待训练模型进行持续训练,使之归纳出处理新数据的规则。

待训练模型通过学习知识成为具有推理和决策能力的训练后模型,从而实现智能化。

因此,相比于传统软件,AI软件开发者更关注的是模型、训练模型的数据以及支撑模型训练的算力。

在传统软件开发过程中,由于没有模型训练的环节,软件开发者一般不需要收集并使用大量的数据。

而在AI软件的开发过程中,软件开发者则必须借助大量且高质量的数据对模型进行训练,并在训练过程中不断优化参数以提高运行效率和准确性。

训练数据通常根据具体的应用场景进行确定。

以计算机视觉应用场景为例,尽管利用一些现有的开源数据也可以对模型进行训练,但是这些数据通常不能很好地满足特定的视觉应用场景需求,解决上述问题的关键在于如何采集足够多的来自于实际应用场景的真实图像或视频数据,并对这些数据进行一定的处理,例如数据清洗、数据标注等。

从软件使用者角度出发,AI软件的安装部署方式与传统软件可能并无明显差异,但是从运营方式和商业模式来看,二者还是存在一定区别。

对于传统软件而言,其对算力的要求相对较低,因此通常是由企业购买后安装在其自有服务器上,相关数据也通常存储在本地计算机或服务器中。

而对于AI软件而言,新兴应用场景产生的海量数据对AI算力的需求持续加大,例如云游戏、自动驾驶等对数据传输的速度和量级都提出了更高的要求,而通过云计算和云部署的方式便可以在很大程度上解决上述问题。

在该等情形下,相关数据则被传输并存储在云端。

为了明确软件许可协议中不同知识产权的权属安排,我们有必要先对软件许可中常见的许可标的进行梳理。

(1)软件许可标的 在传统软件许可协议中,关于许可标的的安排一般会区分源代码和目标代码。

源代码是由程序员用人类可读的语言编写的用于执行某些任务的代码,然后将文件保存为规定的格式,但该等代码未经编译无法被机器直接执行;而目标代码则是通过编译器将源代码转换而成的机器可直接执行的代码。

由于目标代码通常难以被人类所理解,因此倘若需要对软件进行修改,例如增加定制化的功能模块,则往往需要对源代码进行修改。

实践中,如果被许可方对软件的需求仅涉及运行和使用,一般不涉及源代码的交付;但是如果被许可方对软件的维护、调整、改进和升级有特定需求,许可方通常还需要向被许可方交付软件的源代码,并授予其源代码层面的许可。

(2)知识产权权属 在传统软件许可协议中,无论许可标的是目标代码还是源代码,双方均应当对相关知识产权的权属安排进行提前约定,以免后续产生纠纷。

一般而言,软件许可协议的知识产权归属安排会根据时间顺序采用“三段式”的叙述逻辑,即背景知识产权、前景知识产权和改进知识产权。

其中,背景知识产权是指协议一方在履行协议前拥有或取得的技术成果及相关知识产权,前景知识产权是指在双方合作期间产生的知识产权,而改进知识产权则是指对前景知识产权进行的修改、改编或提升,包括但不限于对前景知识产权相关的功能、性能、部件或模块的变更等。

在传统软件许可协议的谈判过程中,以前景知识产权为例,若许可方向被许可方提供目标代码或源代码层面的许可,相关前景知识产权的安排一般需要考虑双方的谈判地位。

强势的一方通常会要求前景知识产权全部归其所有,在某些情形下可以考虑后续免费或附条件地许可另一方使用。

倘若双方之间的谈判地位相当,则一般会约定由做出实质性贡献的一方享有相关前景知识产权。

而在AI软件许可协议中,由于许可标的涉及AI模型,相关前景知识产权在形成与权属约定方面则与传统软件许可协议存在诸多差异。

如上文所述,模型是由训练程序从训练数据中归纳出的某种“推理规则”,在此过程中,训练数据的质量和标注精度对模型的准确性起到至关重要的作用,换言之,训练程序输入不同的训练数据后所输出的模型也不尽相同。

一般而言,模型的训练分为静态训练(static training)和动态训练(dynamic training)两种,因此,模型也分为静态模型与动态模型。

对于静态模型,模型训练好则长期投入使用,而对于动态模型而言,随着新数据的不断输入,通过对这些数据的整合,模型也将不断进行更新迭代。

(3)AIGC的保护 在传统软件许可中,许可方基于目标代码进行研发或创作的成果一般归属于被许可方,例如被许可方利用Word软件编写的文档在构成作品的前提下受到著作权法的保护。

但是,在AI软件许可中,则面临关于人工智能生成内容(Artificial Intelligence Generated Content,“AIGC”)可版权性的讨论,对该问题的具体分析可以参见我们的上一篇文章《ChatGPT出品:谁是作者?》。

整体而言,在现行法律体系下,AIGC很可能难以通过著作权进行保护,以合适的方式向AI使用者明确告知其享有的相关权益至关重要,例如在AIGC构成作品情况下的著作权归属、通过AIGC进行二次创作情况下的相关权益分配等。

(1)“合理使用”的适用困境 根据一般的著作权法理论,“合理使用”是指在特定情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益。

这是因为著作权法的立法目的在于通过授予著作权人垄断权利来鼓励文学、艺术和科学领域的创作和传播,但有一些事项在立法者眼中具有更高的价值位阶,著作权人的垄断权力需要让位于这些事项(例如社会运行过程中对于知识和信息的最基本需求)。

以我国著作权法为例,“合理使用”的事由包括但不限于“个人使用”“适当引用”“在时事新闻报道中使用”“在课堂教学和科学研究中使用”等。

(2)“许可使用”的现实障碍 若AI软件对作品的使用不构成“合理使用”,则必须取得相关作品著作权人的许可。

但是,对于AI模型的训练数据而言,确保训练数据中包含的作品全部获得作品著作权人的许可在现实中并非易事。

一方面,AI软件开发者需要花费大量的时间和成本将可能受保护的作品从训练数据中识别出来;另一方面,针对识别出来的受保护的作品,AI软件开发者还需逐一地与作品的著作权人进行协商取得其许可,并支付许可费用。

考虑到不同作品许可谈判的难度以及AI软件开发的时效性,在实践中逐一取得相关作品著作权人许可的可行性可能并不高。

AI软件许可标的的不同使得AI软件许可协议知识产权条款的设计应当有特殊的考量,而AI模型本身对数据天然的依赖性则要求协议双方在协商谈判时还应当特别关注数据的使用和权属、数据安全合规等在内的相关问题。

(1)数据使用 为了不断提升模型的性能,ChatGPT等AI模型一般还需要使用用户提供的数据作为模型训练的新数据来源。

ChatGPT的使用条款规定:我们不会使用您提供给我们的API或从我们的API接收的内容(“API内容”)来开发和改进我们的服务。

API内容仅用于提供和维护我们的API服务。

我们可能会使用API以外的服务内容(“非API内容”)来帮助开发和改进我们的服务[2]。

在《如何使用您的数据来提高模型性能》文档中,模型开发者进一步明确了使用相关数据的目的:AI模型最有用和最有前途的特性之一是它们可以随着时间的推移而改进。

我们通过科学和工程突破以及接触现实世界的问题和数据不断改进我们的模型[3]。

(2)数据权属 在AIGC的可版权性成为人们的讨论焦点之余,AI相关数据的权属安排也是AI软件许可协议中双方绕不开的话题之一。

正如我们在《数据交易协议:Checklist请收好》一文中所述,总体而言,数据可以分为原始数据和衍生数据。

原始数据是数据采集时提供的、反映客观事物属性的记录,是不经过任何加工、创作或提取、编辑的数据。

衍生数据是指基于特定的商业目的、通过运用一系列技术手段对数据进行筛选、分析、处理从而形成的数据。

AI软件的使用过程中可能涉及的数据主要有三类,包括模型训练阶段使用的训练数据以及模型使用阶段的输入数据和输出数据。

其中,训练数据又包括原始训练数据和训练数据集。

原始训练数据是指模型开发者直接收集的数据,理论上来说,AI模型接受的训练数据越多,其自我进化也会更快,但是这种情况必须建立在训练数据没有任何错误的基础上。

因此,模型开发者往往会在原始训练数据的基础上进行一定的处理,例如数据清洗、数据标注、数据分组等,从而形成高质量和高精准的训练数据集用于模型训练。

模型使用阶段的输入数据一般是具体应用场景下的原始数据,例如使用者的个人信息、受著作权保护的作品等;输出数据即为上文提及的AIGC。

在动态模型训练中,模型使用阶段的输入数据和输出数据也有可能成为新的训练数据以进一步改进模型。

模型开发者为了避免在AI模型实际应用过程中发生训练阶段无法预期的事件,可能会要求将使用阶段采集的数据作为训练数据来生成新的精度更高的模型。

AI模型训练、应用中涉及大量的数据,从行业维度来看,这些数据可以分为金融数据、交通数据、自然资源数据、卫生健康数据、科技数据等;从数据载体维度来看,这些数据可以分为音频数据、视频数据、图像数据、文字数据等;而从数据主体维度来分,上述数据又可以分为个人数据、企业数据和公共数据等。

在AI模型训练和后续的许可中,无论是许可方还是被许可方,均应当特别注意数据的来源合规问题。

此外,在确保数据来源合规的前提下,双方还应当就如何使用相关数据,使用相关数据所应当采取的安全保护措施等进行明确约定。

(1)数据来源合规 考虑到在AI软件许可协议中,数据的使用场景主要包括模型训练阶段对训练数据的使用以及模型使用阶段对输入数据的使用,且模型使用阶段收集的数据后续也可能成为新的训练数据,因此,无论是对于许可方还是被许可方,均应当确保自身使用的数据具有合法来源。

一般而言,对于AI模型而言,获取数据的方式主要包括数据交易、自行采集和开放数据爬取。

数据交易是指通过合法的交易方式从数据提供方处获取相关数据,自行采集是指通过APP、传感器、相机等方式直接采集数据,开放数据爬取则是指通过数据爬虫等方式获取开放的数据。

对于数据交易和自行采集两种获取方式而言,最重要的是要确保如何取得相关数据权利主体的授权。

而对于开放数据爬取而言,则更应当关注数据爬虫行为本身是否合法,例如爬虫所采取的技术手段是否突破数据访问控制、数据爬虫的使用目的是否正当等。

对于许可方而言,例如,在收集和使用个人数据进行模型训练时,可能存在的风险包括但不限于侵犯人格权和个人信息权。

《中华人民共和国民法典》第一百一十条规定:“自然人享有生命权、身体权、健康权、姓名权、肖像权、名誉权、荣誉权、隐私权、婚姻自主权等权利。

”第一百一十一条规定:“自然人的个人信息受法律保护。

任何组织或者个人需要获取他人个人信息的,应当依法取得并确保信息安全,不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。

”《中华人民共和国个人信息保护法》第二条规定:“自然人的个人信息受法律保护,任何组织、个人不得侵害自然人的个人信息权益。

”以个人信息为例,除法律另有规定,许可方只有在取得个人信息主体同意的前提下才能处理相关个人信息。

在该等个人信息来源于其他第三方的情况下,许可方至少还应当要求相关个人信息的提供方保证其提供的个人信息获得了个人信息主体的同意。

(2)数据安全保护 由于AI软件的云计算和云部署等特点,在AI软件许可协议中,许可方的数据安全保护能力往往是被许可方关注的重点。

如前文所述,在AI模型的使用阶段,其会采集各行业领域的不同类型的数据,这些数据中可能包括敏感个人信息,国家重要数据等对安全保护有特殊要求的数据。

以自动驾驶为例,智能驾驶汽车上集成的摄像头、激光雷达、导航仪等各类传感器,每时每刻都在收集车主本人、乘车人、驾驶人等的个人信息、车辆的环境信息以及车辆行驶信息等。

根据《汽车数据安全管理若干规定(试行)》,车辆行踪轨迹、音频、视频、图像和生物识别特征等信息属于敏感个人信息,而军事管理区、国防科工单位以及县级以上党政机关等重要敏感区域的地理信息、人员流量、车辆流量等数据、汽车充电网的运行数据等则属于重要数据[4]。

若汽车数据处理者对收集的上述数据进行不当使用,将可能导致个人信息主体的人身、财产安全以及国家安全受到损害。

对此,法律法规规定汽车数据处理者在处理敏感个人信息时,应当符合特定要求,例如应具有直接服务于个人的目的,包括增强行车安全、智能驾驶、导航等;在处理重要数据时,应当按照规定开展风险评估并形成风险评估报告、报送汽车数据的安全防护和管理措施,包括保存地点、期限等[5]。

因此,在AI软件许可协议中,被许可方应当要求许可方对数据的采集、存储、使用、传输等各方面均采取充分的数据安全保护措施,防止数据被窃取、滥用、篡改或毁损,并对可能因数据安全问题导致的责任承担进行明确约定。

此外,在AI软件许可领域,由于许可方很有可能是境外主体,在该等情形下,数据出境可能引发的数据安全相关问题应当引起被许可方的特别关注。

倘若在使用AI软件过程中确实涉及数据出境,被许可方应当在协议中明确要求许可方遵守数据出境的合规要求和履行数据出境申报义务。

例如,被许可方可以在协议中要求许可方承诺其对相关数据的使用应当遵守中国关于数据出境的相关法律法规。


IP赋能NFT,平台与版权方介绍


目前我国的数字文创作品,或称为数字藏品,从创建到发售的主要环节包括设计、铸造、上链、平台展示及销售。

结合实务中NFT平台的联名企划方案、发行方协议、在售数字文创作品描述等,从经营、开发和盈利的角度而言,目前NFT平台与版权方的合作流线大致如下:

NFT平台与版权方的合作流程一览 根据NFT平台对于其上流通的数字文创产品的决定权,NFT平台的经营模式可以分为“平台准入”模式及“自由入驻”模式。

平台准入模式下,NFT平台上展示及销售的数字文创作品都经由平台方参与设计、铸造等前期工作及最终确认后上架,对于版权方而言,其通常并不享有自由上传内容、铸造及发行和/或销售数字文创作品的权限。

而该等模式下,数字文创作品发售方如何认定则具体取决于版权方和NFT平台之间的约定,往往可以仅是版权方,也可以是NFT平台或由版权方与NFT平台联合发售。

与平台准入模式相比,自由入驻模式下,NFT平台在其中的角色简化为交易场所和相关网络服务的提供者,版权方可以自行在NFT平台上铸造、展示及销售数字文创作品。

国外的实践中,部分平台允许用户上传图片、音乐、影像甚至游戏用交易卡等自行制作NFT作品并发售,例如OpenSea等,而从我们目前的观测来看,在已经有原始作品的情况下,我国目前主流的NFT平台还是采用平台准入模式居多,版权方与NFT平台达成合作意向也因此成为发售数字文创作品的基石。

根据NFT平台的参与深度及权限,NFT平台开发数字文创作品的模式可以分为简单授权模式、全方位运营策划模式与作品孵化模式。

(1) 简单授权 简单授权模式下,NFT平台往往获得的是基于原始作品铸造及发售数字文创作品的权利,例如将现实画作通过数字技术生成3D模型复制品并在平台指定的区块链上生成唯一对应的虚拟凭证进行标识,之后在平台上展示、发售该等数字文创作品,或者针对版权方指定的、特定范围内的内容直接生成相应的NFT作品。

同时,还存在版权方授权NFT平台以原始作品的素材、标志、片段、元素等为基础进行二次创作,再将新作品铸造为数字文创作品并于平台发售的合作模式。

简单授权模式多见于NFT平台与政府部门、博物馆、私人收藏家就特定的旅游地标、文物、知名艺术品等打造数字文创作品,相较于强调加工创作、艺术设计,这一类的合作往往更加注重在虚拟空间还原、呈现原始作品。

(2) 全方位运营策划 全方位运营策划模式在简单授权模式的基础上赋予了NFT平台针对数字文创作品更多的代理运营权限。

该模式下,NFT平台除了负责前述数字文创作品的铸造、发售及交易行为相关的日常运营外,还有权代理版权方就前述数字文创作品进行商业洽谈、开展推广宣传活动等。

相较简单授权模式下NFT平台仅被授权铸造、发售数字文创作品、无法就数字文创作品进行再开发,全方位运营策划模式中,在获得版权方充分授权的前提下,NFT平台可以就原始作品的二次创作、数字文创作品的设计、线上玩法与线下场景等进行策划和执行。

该模式更适配于对数字文创作品的推广宣传、商业合作有更高需求和接受度的版权方及具备相应商务资源的NFT平台。

(3) 作品孵化 无论是简单授权模式或是全方位运营策划模式,数字文创作品通常依赖于版权方既有的、成熟的IP内容,例如影视剧或文学作品、音乐、游戏、动漫,或画作、雕塑等艺术品。

与之相对,也有从“0”打造数字文创作品的模式,NFT平台与掌握一定IP内容的版权方或是具有设计创作能力的创作者共同“孵化”数字文创作品。

与前两种模式相比,该等作品孵化模式下,版权方很可能是仅能提供商标、品牌标识等元素的企业,或者是具有原创能力的作者个人,但对于如何将该等元素或原创能力生成数字文创作品以及后续的全链条运营,则需要NFT平台提供从策划方案到落地执行的“一揽子”服务。

相应地,NFT平台需要获取的权利范围也会显著扩大,一方面,NFT平台自身由于加入了“创作孵化”,很可能兼任版权方及发售方的角色,同时对于数字文创作品享有更大的运营权限。

另一方面,不仅限于作品本身,NFT平台还可能享有围绕作者所展开的一系列经纪代理权限,例如安排、管理作者的线上、线下各类商务合作活动等。

NFT平台与版权方就合作发售数字文创作品所涉及的费用(以下简称“合作费”)通常包括基础费用以及基于发售数字文创作品所得收益的分配(以下简称“收益分配”)。

基础费用方面,NFT平台往往需要针对生成、运营数字文创作品获得版权方的授权向版权方支付相应的授权费,授权费的金额一般与IP内容的价值、授权范围等相关。

同时,版权方应就委托NFT平台将原始作品铸造上链生成数字文创作品并于平台展示、发售向NFT平台支付一定的服务费,服务费一般是按照技术服务的固定收费标准计算。

如果版权方提供给NFT平台的原始作品涉嫌侵犯他人权益,包括但不限于因版权方未获得授权或超越授权范围导致的情况,复制、改编该等原始作品及发行、销售因此形成的数字文创作品可能侵犯权利人的复制权、发行权和信息网络传播权等权益,NFT平台不仅会面临权利人的投诉和索赔,还可能需要召回已售出的侵权数字文创作品并向消费者承担赔偿责任。



更多关于 ChatGPT许可应用,知识产权和数据讲解,IP赋能NFT,平台与版权方介绍 的资讯,可咨询 乐知网。

(乐知网- 领先的一站式知识产权服务平台,聚焦 专利申请,商标注册 业务)。


关键词: 发明专利申请 专利代理