【编者按】
数字时代背景下的全球科技创新,正处于多点突破的关键期,我国参与科技创新、引领科技创新的能力正不断加强。
今年全国两会,科技领域有哪些热门话题?代表、委员们带来了哪些建议?封面新闻专访多位科技领域与会者,听听他们对科技创新引领高质量发展的建言。
全国政协委员、中国科学院科技战略咨询研究院副院长张凤。受访者供图
“大模型发展热潮席卷全球,我国大模型呈现爆发式增长,但我国大模型领域仍在核心技术自主可控和技术应用安全等方面存在挑战,亟须进一步统筹大模型创新发展与安全应用,抢占人工智能国际竞争制高点。” 全国政协委员、中国科学院科技战略咨询研究院副院长张凤说。
今年全国两会期间,张凤在接受封面新闻记者专访时表示,她在《关于进一步统筹大模型创新发展与安全应用的提案》中,建议打造高度国产化的人工智能产业链,上下游协同打破“卡脖子”困局;统筹推进大规模数据集建设,加速大模型迭代发展;加强技术安全评测,确保应用安全有序;完善伦理规范,构建负责任、可信赖的大模型发展生态。
大模型关键核心技术面临“卡脖子”风险
张凤指出,人工智能技术具有巨大的赋能潜力,将推动经济社会的千行百业向数字化、网络化、智能化加速跃升,大模型作为人工智能的重要发展方向同样值得关注。近年来,我国大模型呈现爆发式增长,进入“百模时代”。
“尽管我国大模型领域已取得一定成就,但我们要清楚地认识到,我国在大模型核心算法、深度学习框架等关键核心技术方面,仍对外依赖严重,面临‘卡脖子’风险”。
她坦言,高质量数据集和场景数据开放不足也是值得注意的问题。目前,由于数据权属不清晰、开放共享规范不明确等问题,大批量、高质量的中文语料数据难以公开获取,场景数据公开少,阻碍大模型数据、技术和应用的闭环协同发展。
大模型应用面临“治理难”挑战
“我们认为,在推动大模型创新发展,抢占科技制高点的同时,也要注意应用安全的问题。目前来看,大模型应用带来多方面风险,面临‘治理难’挑战。”
大模型的应用风险具体有哪些?张凤告诉记者,随着生成文本、视频等内容的质量越来越高,加剧“深度伪造”风险,容易引发有害内容、虚假信息、诽谤、隐私侵犯等问题,导致价值观误导和社会信任下降。
她介绍,大模型的技术特征决定了需要获取大量的场景数据,可能涉及个人信息、商业秘密、机器数据等数据收集,存在重要数据泄露风险。此外,大模型实现了对互联网海量内容、数据、文本的学习整合优化,这在一定程度上存在对原有内容的“剽窃”,存在知识产权纠纷的隐患。
她还强调,当大模型预训练数据不足以代表整个样本空间,模型可能会在预测中出现偏见,特别是医疗领域的算法偏见可能带来诊断的偏差。
完善大模型伦理规范 构建可信赖的大模型发展生态
“我国大模型领域仍在核心技术自主可控和技术应用安全等方面存在问题挑战,亟须进一步统筹大模型创新发展与安全应用,抢占人工智能国际竞争制高点。”
为此,张凤建议,打造高度国产化的人工智能产业链。软硬结合、上下游协同,打破高端GPU芯片困局;支持国产领先深度学习框架企业牵头,开展与国产芯片厂商的广泛适配和软硬件协同优化;基于国产化算力平台,孵化国产化原生大模型,强化需求端发力,通过资金补贴,支持中小企业和创业者调用大模型接口,降低使用成本等。
在她看来,统筹推进大规模数据集建设也是关键手段。推动用于公共治理、公益服务的优质公共数据进一步开放,在严格保障数据安全的前提下,在国内数据要素市场化发展领先的北京等地区遴选典型场景数据集,有条件向大模型科技领军企业开放使用。
她还建议,加强大模型技术安全评测。制定适用于大模型的安全规范和标准,开展大模型数据隐私保护、模型安全等安全性评估和漏洞检测,引导企业在技术研发、产品设计和运营过程中遵循相关标准。提高机密计算、存储防勒索等安全技术应用,加强基础设施安全评测。
她认为,完善大模型伦理规范同样重要。应加快对大模型和数据集相关的道德伦理和治理研究,制定适用于大模型的伦理规范和行为准则,鼓励企业开展相关的道德和社会责任评估工作。
“我们希望通过技术创新与治理创新,构建负责任、可信赖的大模型发展生态,进一步推动大模型在各个领域、行业的深度应用,使其真正造福社会。”
(来源: 封面新闻,作者: 记者 张馨心 见习记者 赵雨笙,张凤系民进中央委员)