作者 :寿步,上海交通大学法学院教授、博士生导师
中国科学技术大学兼职教授
本文来源 :网络空间治理
感谢作者授权推送
征求意见稿第四条要求提供GenAI产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合列明的五项要求。
其中的第(一)项是“利用生成式人工智能生成的内容应当体现社会主义核心价值观,不得含有颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情信息,虚假信息,以及可能扰乱经济秩序和社会秩序的内容。”第(三)项是“尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争。”第(五)项是“尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权。禁止非法获取、披露、利用个人信息和隐私、商业秘密。” 第(一)、(三)、(五)项的这些要求,在现行的法律法规(如网络安全法、知识产权相关法律、个人信息保护法、民法典等)中都有明确规定。在此情况下,是否还需要为GenAI制订新的部门规章?
在上述三项要求之外,征求意见稿第四条第(二)、(四)项看起来体现了GenAI的特殊性:“(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。”“(四)利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。”
——关于第(二)项要求,一方面,在《网络信息内容生态治理规定》中已有类似的规定;另一方面,这里除了“提供服务”之外,还涉及“算法设计、训练数据选择、模型生成和优化”等技术环节,在国内外相关机构近几年已经提出的多份人工智能伦理治理相关文件基础上,能否采用制订国家标准的方式(而不是制订新的部门规章的方式)对GenAI加以规范?采用国家标准进行技术的伦理治理既方便规范本身对技术发展保持足够的弹性,也方便随着技术的发展进行与时俱进的修订。
——关于第(四)项的要求,问题在于:GenAI生成内容的“真实”和“虚假”的标准如何确定?如何根据合理的真假标准进行执法?举例来说,如果GenAI生成一个“说谎者悖论”(“我现在说的这句话是谎话”),如何判定其真假、如何执法?
征求意见稿第六条规定:“利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。”
从《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》和《互联网信息服务算法推荐管理规定》这两份文件的内容看,利用GenAI产品向公众提供服务已经符合这两份文件的适用条件,因此适用这两份文件是不言而喻的。
4.1关于GenAI的定义
征求意见稿的“生成式人工智能”定义为:“是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。”该定义或可改进。
查https://generativeai.net/给出的GenAI定义——Generative AI (GenAI) is a type of Artificial Intelligence that can create a wide variety of data, such as images, videos, audio, text, and 3D models. It does this by learning patterns from existing data, then using this knowledge to generate new and unique outputs. GenAI is capable of producing highly realistic and complex content that mimics human creativity, making it a valuable tool for many industries such as gaming, entertainment, and product design. Recent breakthroughs in the field, such as GPT (Generative Pre-trained Transformer) and Midjourney, have significantly advanced the capabilities of GenAI. These advancements have opened up new possibilities for using GenAI to solve complex problems, create art, and even assist in scientific research. 【对应的译文】“生成式人工智能(GenAI)是人工智能的一种类型,可以创造各种各样的数据,如图像、视频、音频、文本和3D模型。它通过从现有数据中学习模式,然后使用这些知识来生成新的和独特的输出。GenAI能够产生高度逼真和复杂的内容,模仿人类的创造力,使其成为如游戏、娱乐和产品设计等许多行业的有价值的工具。该领域最近的突破,如GPT(生成性预训练转化器)和Midjourney,大大提升了GenAI的能力。这些进步为使用GenAI解决复杂问题、创造艺术、甚至协助科学研究开辟了新的可能性。”
注意到,https://generativeai.net/给出的GenAI定义中给出生成内容的类型时列明“图像、视频、音频、文本和3D模型”;而征求意见稿的GenAI定义中给出生成内容的类型时列明“文本、图片、声音、视频、代码”。
征求意见稿所列明的类型存在下列问题:(1)这里的“图片”在征求意见稿第五条中又表述为“图像”,它们都对应于image,宜统一表述为“图像”。(2)这里的“声音”宜改为“音频”(audio),以对应于“视频”(video)。(3)这里的“代码”本身也是一种“文本”( text),应当包含在“文本”范畴内,就像WTO的TRIPS协议第10条第1款规定将(以源代码或者以目标代码表达的)计算机程序作为文字作品保护那样。(4)删除“代码”后,在定义中可以补入“3D模型”。因此,征求意见稿的GenAI定义中给出生成内容的类型时应该列明的是“文本、图像、音频、视频、3D模型”。
4.2关于《互联网信息服务深度合成管理规定》
由国家网信办、工信部、公安部联合发布的《互联网信息服务深度合成管理规定》自2023年1月10日起施行。其中定义“深度合成技术”如下:
“是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包括但不限于:
(一)篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术;
(二)文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术;
(三)音乐生成、场景声编辑等生成或者编辑非语音内容的技术;
(四)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术;
(五)图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术;
(六)三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术。”
比较《互联网信息服务深度合成管理规定》中关于深度合成技术的定义与征求意见稿的GenAI的定义,可见两者所指对象高度重合。
注意到,《互联网信息服务深度合成管理规定》是2022年11月25日由国家网信办、工信部、公安部联合发布的;当今全球关注的ChatGPT则是在2022年12月上线的。因此,一方面的问题是:在前不久发布施行《互联网信息服务深度合成管理规定》的情况下,是否有必要另行制订《生成式人工智能服务管理办法》?另一方面的问题是:如果确有必要针对ChatGPT引出的(但在《互联网信息服务深度合成管理规定》中尚未规范的)新问题进行规范,能否通过修改《互联网信息服务深度合成管理规定》的方式加以解决?
《生成式人工智能服务管理办法》的立法必要性值得进一步探讨。
点击下方公众号名片
获取更多信息