论坛动态

我国数据知识产权保护现状与挑战

发布时间:2023-12-22 来源:

摘要


目前,我国在开放科学背景下的数据知识产权发展面临挑战,如知识产权大数据保护水平需提升、生成式人工智能面临知识产权风险等。


对此,本文围绕进一步加强数据专利保护、推动数据知识产权公共服务普惠发展、培养数据知识产权保护专业人才、知识产权大数据赋能创新与产业发展、数据知识产权保护等方面提出建议,为提升知识产权全链条服务水平提供参考。



开放科学指的是科学家通过互联网免费分享他们的研究数据、方法、代码、实验室笔记和其他研究过程,以便资料能够被重复使用,实现协作研究的科学实践。开放科学目前的趋势是在研究过程的早期阶段就共享和使用所有可用的知识,以达到消除科学研究过程中的访问障碍,使得研究者可以共享任何类型的研究成果、资源、方法或工具,促进科学的自由传播,加强科学合作和信息共享,从而共同推动科学进步。


科学数据是国家科技创新和发展的基础性战略资源, 并具有巨大的潜在价值和可开发价值。大数据是人工智能实现智能化的基础,人工智能的算法需要大量的数据进行训练和优化,才能得到更高的准确性和精度。通过分析大数据,人工智能可以识别出数据中的模式和趋势,并利用这些信息来推断新的结果。生成式人工智能产品具有强大的生成和创造能力,可应用于图像生成、文本生成、语音合成等领域。


随着新一轮科技革命和产业变革深入发展,数字化转型已是大势所趋。数据作为数字经济的核心要素,已成为土地、劳动力、技术、资金之外的“第五要素”,其商业价值日益凸显,正逐渐成为经济高质量发展的重要支撑, 数据知识产权保护需求应运而生。


一、我国数据知识产权保护现状


作为国家战略性资源,知识产权信息是创新创造的源泉和基础,能够推动创新,提高企业竞争力,实现产业转移转换。加强知识产权信息的公开和分析利用,能够拓展创新发展的脉络和路径,提高创新起点,减少重复研发, 节约创新成本,有助于实现知识产权制度的价值,推动数据要素开放和知识产权公共服务。


随着信息技术、生命科技等前沿技术的快速发展,世界各国都在积极加强知识产权立法工作,知识产权的保护范围持续扩大,保护水平和保护力度不断提升。知识产权申请或注册数量快速增长,掌握和控制关键领域和前沿技术中的知识产权已成为各国竞争的焦点。


我国越来越意识到知识产权的重要性,不断完善知识产权保护的法律体系和基本规则,实施一系列措施加强知识产权保护。国家知识产权局于2023 年3 月1 日印发了《2023 年全国知识产权行政保护工作方案》,提出全面提高知识产权保护效果,助力知识产权强国建设,护航创新创业全链条,促进经济社会高质量发展。


近年来,我国数据知识产权快速发展。一是知识产权创造质量稳步提升。2022 年全年授权发明专利79.8 万件, 每万人口高价值发明专利拥有量达到9.4 件。二是知识产权保护力度不断增强。新修订的《中华人民共和国反垄断法》《中华人民共和国科学技术进步法》以及《中华人民共和国种子法》正式实施。数据知识产权保护规则研究和地方试点有序推进。三是知识产权运用效益更加凸显。专利密集型产业增加值达到14.3 万亿元(2021 年值), 同比增长17.9%,占GDP 比重达到12.44%。四是知识产权服务能力持续提高。有效落实国务院营商环境创新试点15 项知识产权改革任务,专利商标电子申请率均超99%,实现证书电子化。五是知识产权国际合作与竞争深入开展。加强涉及国家安全的知识产权对外转让行为管理, 切实维护知识产权领域国家安全和我国企业海外知识产权合法利益。


2016 年至2022 年,我国数字经济核心产业发明专利授权量年均增速达18%。截至2022 年底,我国数字经济核心产业发明专利有效量达160 万件,占发明专利总有效量的38%,有力支撑了产业数字化转型升级。已初步明确数据知识产权的保护对象、保护主体、赋权方式、权益内容、保护方式和运用模式等6 个方面的基本内容,并在北京市、上海市、江苏省、浙江省、福建省、山东省、广东省等7 个地方开展数据知识产权工作试点。在制度建设方面,多地已将数据知识产权工作的内容纳入本地数字经济发展、数据基础制度构建等相关地方性政策法规中, 并相继出台数据知识产权登记管理办法等配套文件。在登记实践方面,已经有北京、浙江、江苏、山东、福建、深圳等省市开展数据知识产权登记工作。


生成式人工智能指的是利用海量数据集和深度学习、强化学习等生成、合成类算法制作文本、图像、音频、视频等内容的技术。其产品在数据来源的合法性、训练数据库的输入阶段和输出阶段等方面都涉及知识产权风险,不仅涉及著作权、财产权保护问题,也会涉及署名权、修改权等人身权问题。我国目前尚未建立完善的制度以保护生成式人工智能产品所涉及的知识产权。


二、数据知识产权面临的挑战


尽管近年来我国知识产权保护力度不断加强,但仍面临诸多挑战: 


一是知识产权大数据保护水平需提升。首先,需要明确如何界定知识产权大数据的所有权和保护范畴,防止其被侵犯或滥用,保持数据开放和安全的平衡;其次,知识产权大数据的质量直接决定其价值和可信度,需重视确保数据的真实性、准确性、完整性、时效性和一致性,防范数据泄漏、被损毁或攻击;再次,知识产权大数据的分析和应用需借助先进的技术和方法,需要探索如何提高效率, 克服局限性和风险,推动知识产权的创新和发展。


二是生成式人工智能面临知识产权风险及治理挑战。生成式人工智能给知识产权带来的挑战主要集中在版权、专利权和商标权三个方面。在版权方面,随着大数据、神经网络等技术的发展,人工智能可以模拟人脑中神经元的深度学习,可以从庞大的数据库中自动选择所需的材料进行集成处理。人工智能的作用已经远远超过最初的辅助性工具定义,例如在新闻写作领域,腾讯写稿机器人Dream Writer 可以独立完成新闻写作,在财经、科技应用、体育赛事等领域撰稿超过两千篇。知识产品由人工智能所创造,人工智能生成作品是否享有版权,以及专利剽窃问题等值得商榷。在专利权方面,由于人工智能技术会随着时间的推移而发展,它最初可能不会侵犯专利的权利要求,但随着它学习和修改其内部操作和外部行为,可能会出现侵权行为,而且它的使用也会产生知识产权侵权的情况。此外,生成式人工智能较易扩展现有技术边界且在某些领域价值较高,可能会酿成“反公地悲剧”(公共资源由于受到约束被限制开发而导致浪费的问题)。同时, 生成式人工智能还有可能沦为人类借由专利侵权诉讼获取利益的工具。在商标权方面,生成式人工智能可以在短时间内快速扩容商标体量,并且生成的商标显著性越强,人类可设计的商标数量就越有限。由于判断商标是否近似以及是否构成《中华人民共和国商标法》意义上使用的主观性较强,而生成式人工智能的判断能力有别于人类,由此导致设计出的商标存在侵权风险。


三是数据知识产权面临更复杂和高难度的挑战。传统知识产权主要针对实物产品、方法或服务,如专利、商标、著作权等,而数字经济时代的知识产权则主要针对数字产品或服务,如软件、网络内容、数字音乐等。目前,数字技术的发展速度远超过知识产权法律的制定和完善速度, 导致知识产权法律体系存在滞后的情况。数字经济的特点是技术含量高、产权多样、应用范围广,这对于保护知识产权提出了更加复杂和高难度的挑战。此外,由于数据知识产权的保护对应用领域和技术水平的要求较高,因此专业的技术人才和高端人才短缺也会限制其保护效果。


四是数据知识产权界定存在困难,数据要素确权存在难题。数据本身的复杂性是数据知识产权存在难以界定的重要原因之一。在法律学的层面上,数据信息作为法律关系客体,数据权利是以数据权利客体“数据”来定义的, 而当前我们对于数据的认识还不全面。例如,当前生成式人工智能产品在快速发展,表现在其产品的训练和生成过程涉及大量数据,这些数据的来源、类型、用途等都非常复杂,加大了对数据知识产权界定和确权的困难;另外, 人工智能算法会对数据进行深度学习和创新性的处理,其产品甚至可以做到“以假乱真”。而面对这种情况,生成的数据可能来自多个知识产权的权利人,这就使得对于明确这些数据的权利归属的需求会更加迫切,而目前还没有权威、公认的界定数据产权的方法,理论层面仍存在多项需进一步探索之处。作为可有效激励数据生产和流通的数据确权,其自身也面临着诸多挑战,例如:难以确定数据主体、数据要素确权成本较高、识别和追踪数据要素的侵权行为较为困难、数据要素市场化体系建设尚不完善以及跨领域合作不足等,这些进一步加深了人们对于数据知识产权相关问题的思考。


五是我国数据知识产权保护制度仍缺乏统筹设计,管理机制尚不健全。首先,我国数据知识产权保护缺乏专门的法律规范,对数据知识产权的保护更多的是从《著作权法》中的汇编作品入手,要求被保护的数据知识产权具有“独创性”,而对于数据本身则并不涉及。对数据本身的保护更多是从《民法典》与《反不正当竞争法》的角度入手,这样的保护思路已经落后于数据时代的需要,统一的数据知识产权保护框架和规则体系尚未建立,且相应的制度措施的科学性还有待优化。因为数据知识产权界定存在困难、缺乏平台监管,一些数据侵权行为无法及时发现和处理。


三、开放科学背景下数据知识产权保护的意义


数据是发展数字经济的关键性生产要素,该领域知识产权的保护和运用受到广泛的关注,在开放科学背景下数据知识产权的保护具有重大的意义,主要体现在以下几点: 


一是可以促进数据的自由流动和有序流动。数据共享和共创是推动科学进步和创新的一个重要途径,而数据知识产权保护可以鼓励更多人参与数据共享和共创,从而促进数据的自由流动。有效保护数据权利人的合法权益,也可以建立公平、公正、有序的数据市场秩序,有助于防止数据垄断、数据抄袭、恶意竞争,从而保障数据的有序流动和稳定发展。


二是提高数据作为生产要素的配置效率。一方面,通过对于数据知识产权保护,本身就可以鼓励更多人积极参与数据创新和创造,进而推动数据供给质量的提升以及多样性的提高,这有助于满足社会对数据的需求,推动数据市场的繁荣和发展;另一方面,现有数据本身并非单纯的虚拟数据,也会带来经济等方面的很多价值。通过对数据知识产权的保护,可以促进数据的合理利用和有序流动, 提高数据要素在多领域的价值,促进与其他生产要素的融合,这也有助于生成更多有价值的数据产品和服务。


三是可激发全社会的创造力和市场活力。根据2021 年的统计,大数据产业规模超1 万亿元,预计到2025 年大数据产业测算规模将突破3 万亿元,年均复合增长率保持在25% 左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。我国数据产业快速起步,而对应的数据知识产权保护也显得更加重要。目前数据产业已经成为新的经济增长点,可以通过保护数据知识产权, 吸引更多投资和人才进入数据产业领域,推动产业发展和创新。数据知识产权保护本身也可以保障数据权利人的合法权益,增强社会对数据的信任和信心,进而推动数据流通和应用。在开放科学背景下,进行数据知识产权保护可以促进不同领域之间的跨界融合和创新,最终实现互联网、大数据、人工智能等新技术、新业态的健康有序发展。


四是可推动生成式人工智能知识产权保护。当前在科学研究领域,随着信息技术的高速发展,推动着大数据时代新科学范式的数据密集型科学发现(Data-Intensive Scientific Discovery)的出现,数据作为科研第四范式, 在开放科学背景下,数据知识产权保护的重要性日益凸显, 它不仅可以激励更多的创新发展,保护创新者的合法权益, 而且还可以有效地推动生成式人工智能知识产权的保护。对于生成式人工智能产品来说,数据知识产权保护的推动作用显得更为重要,体现在数据是生成式人工智能产品的基础,只有保证数据的合法获取和使用,才能保证生成式人工智能产品的合规性。数据知识产权保护可以有效保护生成式人工智能产品的创新成果。从这点来看,在数据知识产权保护的推动下,生成式人工智能产品也将会实现井喷式发展。当然这一切需要我们不断完善和强化数据知识产权保护,解决一系列可能产生的新挑战和新问题。


四、数据知识产权保护发展的建议


一是进一步完善与数据知识产权保护相关的法律法规,并进一步加强专利保护。我国已经陆续印发《知识产权强国建设纲要(2021—2035 年)》《“十四五”国家知识产权保护和运用规划》《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)《生成式人工智能服务管理办法(征求意见稿)》等文件,为知识产权的保护提供了法律依据,但目前与数据开放、数据安全和数据产权有关的法律法规还不够完善, 这已成为制约数字经济健康发展的主要因素,需尽快出台针对数据知识产权保护的相关法律,对数据信息的开放、采集、存管、交易、传输和二次利用等相关权责作出明确界定,完善的法律体系能更好地为数据知识产权的保护及数字经济的发展保驾护航。


二是构建数据知识产权开放平台。数据知识产权开放平台可以使沉寂的专利数据真正“活”起来,这将为推动产业发展、探索新的商业模式等提供良好的平台。数字经济时代,经济、贸易等领域的数据要想发挥更大的作用和带来经济效益,需要和各类基础数据紧密结合, 形成真正的数据系统,需要政府部门、企业、知识产权服务机构和数据服务机构之间的良好沟通和协作。大力推动数据知识产权开放平台建设,有助于服务有需求的群体,降低其获取和利用的成本,促进产业结构升级、经济发展和社会进步。


三是培养知识产权保护专业人才。在关键核心技术领域创新和“卡脖子”技术攻关中,知识产权情报的支撑至关重要,需要专业人士获取、挖掘和利用知识产权信息, 将其与技术信息深度融合,助力研发人员展开探索。面对复杂的国际形势和周边环境,需要大量国际化、现代化的知识产权情报人才,支撑构建高质量、高效率的知识产权智库和社会服务体系,助力我国经济社会高质量发展。培养人才需要利用知识产权分析工具让学生进行实操训练, 加强对新兴技术领域知识产权信息的分析研究,为研究机构和研发投资人提供决策依据,打造专利信息师资团队, 培养全国知识产权领军人才、专利信息师资人才和实务人才,多方合作打造立体化的课程资源体系。支持高校与知识产权服务机构联合培养数据知识产权相关的专业人才和进行大数据知识产权领域的相关学术研究。同时,充分发挥世界知识产权组织、大湾区科学论坛等国际组织平台的作用,培养数据知识产权专业人才。


四是营造良好的数据知识产权发展环境。应研究制定促进数据知识产权发展的政策措施,通过提供优惠政策, 引导国家财政资金、金融机构和社会资本投入大数据产业的建设和发展。组织开展数据知识产权方面的培训和宣传活动。鼓励高校、科研院所、知识产权服务机构和数据服务机构基于自身技术优势进行数据知识产权领域的相关研究,提供专业化的数据运营服务,实现数据知识产权制度在金融、能源等领域的落地应用,在实践探索中逐步总结数据知识产权制度的有效经验,形成可复制、可推广的成功模式。


五是构建全方位的数据知识产权服务生态体系。整合人力资源、科技资源、数据优势、服务优势,打造长期稳定、可持续发展、安全可控、绿色高效的知识产权服务新范式。加强信息化、智能化、数字化技术的投入,在知识产权领域加大技术投入,推动数字化社会的升级转型。开展线上和线下服务融合,提升知识产权服务效率。利用知识产权大数据为创新提供支持,节约创新成本,促进创新成果转化;加强知识产权大数据的管理和保护,防止侵犯或滥用;提升知识产权大数据的分析和应用能力,促进知识产权的创新和发展。


六是科学面对生成式人工智能的知识产权风险及其治理挑战。在版权方面,满足版权要求的生成式人工智能应享受法律保护,然而此类保护应当有所限制,以平衡公平与效率。在版权归属问题上,需综合考虑实际贡献原则、保护隐私权原则、意识自治原则等。新制度设计需尊重版权的私权性和开放性。对于生成式人工智能作品,在著作人身权上仅保留署名权和保护作品完整权,在著作财产权上仅保留有限财产权。涉及国家秘密的作品应禁止使用, 涉及商业秘密和个人隐私等敏感内容的作品须经权利人同意才能使用。在专利权方面,发明人、代理机构和审查员应加强对生成式人工智能专利说明书的审查,尤其对具体实施方式的审查,以避免负面效果。应重点提高专利授权的质量,避免低质量专利被授权。整体而言,人工智能属于专利密集型的技术领域,法院或执法者应避免降低专利授权标准,避免过多的传统技术与人工智能场景的结合并专利化,从而阻碍正常的技术竞争。在商标权方面,应肯定生成式人工智能商标的商标法地位,但鉴于商标关系到商业秩序,对生成式人工智能商标的治理应以避免公众混淆误认为前提,合理运用主观裁量,保持生成式人工智能商标的私权性,加强人工审查,注册条件上可以加强对“以使用为目的”要件的审查。


七是提升知识产权全链条服务水平。将知识产权服务与区域经济建设深度融合,注重知识产权对创新质量的提升,强化知识产权对科技成果转化效益的提升,构建知识产权联动保护机制,推动知识产权公共服务质量的提升, 助力创新主体提高核心竞争力,推动知识产权人文关系向好,推进创新、诚信守法、公平竞争的文化理念。


(林瀚程、温彤彤亦参与本文写作。作者聂晓伟、潘小多系中国科学院青藏高原研究所青藏高原地球系统与资源环境重点实验室研究员,张卓颖系中国科学院青藏高原研究所青藏高原地球系统与资源环境重点实验室副研究员,林洁贞系广东省灵山论坛科学中心战略研究组高级主管,林瀚程系广东省灵山论坛科学中心战略研究组研究专员,温彤彤系广东省灵山论坛科学中心综合组行政专员,文章原标题:开放科学背景下数据知识产权面临的挑战)


(本文刊登于《企业改革与发展》杂志第12期。如需转载,请注明出处。文中观点仅代表作者观点,供诸君思考。)








附件: