近年来,人工智能技术正在加速释放应用潜力,成为新一轮科技革命和产业变革的重要驱动力。把握人工智能产业发展趋势,将是企业提升核心市场竞争力、各行业实现高效率智能化转型升级、数字经济新业态多元蓬勃发展的关键所在。
近日,毕马威中国联合中关村产业研究院共同发布了《人工智能全域变革图景展望:跃迁点来临(2023)》报告,总结了人工智能产业在技术变革、应用创新、安全治理、产业协同四方面的10大发展趋势。以下为内容精华,enjoy:
技术变革:算法、数据、算力并进
1、 多模态预训练大模型将成“标配”
多模态预训练大模型包含三大特点:一是训练数据规模大;二是通过“预训练”阶段集中学习到尽可能泛化的通用特征,适合广泛应用;三是训练数据来源和形式具有多样性,也即“多模态”,以支持文本、图像、音频、视频等多种任务处理,达到更接近于人类接收、处理、表达信息的方式。
未来,各家大模型的比拼重点将不再是单一模态下参数量的提升,而是转向多模态信息整合和深度挖掘,多模态预训练大模型也将成为AI大模型的主流形态。
当前,国内AI企业正加速跟进这一趋势,并已取得积极成果。
君联资本所投企业智谱AI于2023年10月推出了全自研的第三代基座大模型ChatGLM3及相关系列产品。ChatGLM3瞄向视觉模态GPT-4V,实现了若干全新功能的迭代升级,其中包括具备多模态理解能力的CogVLM,能够看图识语义,在10余个国际标准图文评测数据集上取得SOTA。在全新升级的ChatGLM3赋能下,公司的生成式AI助手智谱清言已成为国内首个具备代码交互能力的大模型产品。
2、 高质量数据需求驱动数据智能
大模型训练需要大量高质量数据,但是目前数据质量还存在一定问题,如数据噪声、数据缺失、数据不平衡等,均会影响大模型的训练效果和准确性。数据智能技术则成为提升数据质量、挖掘数据价值的有效工具。
数据智能是指从数据中提炼、发掘、获取有揭示性和可操作性的信息,从而为人们在基于数据制定决策或执行任务时提供有效的智能支持。数据智能融合了数据处理、数据挖掘、机器学习、人机交互、可视化等多种底层技术,有望在大模型发展需求驱动下实现跨越式发展。
3、 智能算力将“无处不在”
目前大模型发展如火如荼,训练算力需求有望扩张到原来的10-100倍,变革传统计算范式成为必然趋势。对此,产业界正加速推动芯片和计算架构创新。
在此背景下,新硬件、新架构竞相涌现,现有芯片、操作系统、应用软件等都可能被推翻重来,预计有望实现“万物皆数据、无数不计算、无算不智能”,即智能算力将无处不在,呈现“多元异构、软硬件协同、绿色集约、云边端一体化”四大特征。
作为全球领先的算力厂商,联想集团目前已经初步形成全栈AI服务器产品矩阵,连同先进存储、数据网络、超融合、高性能计算以及异构算力调度平台,为客户提供智能算力中心方案和服务核心产品。
联想智算中心解决方案和服务核心产品涵盖三大类解决方案和两大类服务。三大类解决方案包括:联想大脑嵌入的解决方案、联想混合云解决方案、联想绿色低碳智算中心基础设施。两大类服务包括:端到端全周期联想智算中心服务,以及按需订阅、灵活付费的联想臻算服务2.0。
应用创新:有望重塑生产消费形态
4、 AIGC应用向全场景渗透
人工智能生成内容(AIGC)指利用各类机器学习算法,从数据要素中学习,使机器能自动生成全新的文本、图像、音频、视频等多媒体内容。
AIGC对激发灵感、辅助创作、验证创意等大有助益,且能更低成本、更高效率地生产内容,目前主要应用在广告营销、游戏创作、艺术设计等创造性工作场景,正加速向全场景渗透。未来AIGC仍需要在内容准确性、细节把控度、风格个性化等方面持续优化,并与业务需求有效结合。
5、 AI4S从单点突破迈向平台化
AI4S(AI for Science,人工智能驱动科学研究)是利用AI的技术和方法,去学习、模拟、预测和优化自然界和人类社会的各种现象和规律,从而推动科研创新。AI4S可显著降低前沿科技研究中的智力成本并提升研究效率,主要应用领域包括生命科学、气象预测、数学、分子动力学等。
在“单点突破”阶段,AI4S发展由科研学者主导,数据、模型、算法及方法论的原创性是市场关注重点。迈向“平台化”发展,需要将AI单点应用价值进一步沉淀为平台化工具,提升通用性价值,因此工程师和科研学者将共同主导AI4S下一阶段的发展,助力打造一批“高效便捷、开箱即用”的科学研究智能化工具。
6、 具身智能、脑机接口等开启AGI应用探索
通用人工智能(AGI)指与意识、感性、知识、自觉等人类特征相连结,能够执行人类智力行为的机器智能。AGI技术原理强调两大特性:一是需要基于先进算法实现智能处理和决策;二是需要具备和人类大脑相似的认知架构,包括感知、记忆、分析等。
当前语言类大模型在文本对话领域表现出和人类行为的相似性,但其实时感知能力处于弱势,具身智能、脑机接口则有望弥补这一短板。目前具身智能、脑机接口技术均处于早期孵化阶段,存在核心技术不成熟、研发成本较高、场景化应用难度高、监管制度缺位等挑战,要想实现商业化应用还需持续探索。
安全治理:保障科技向善
7、 人工智能安全治理趋严、趋紧、趋难
人工智能发展存在三方面挑战:一是技术安全,AI技术的复杂性和不透明性造成“黑箱”困境;二是应用安全,大模型与AIGC的快速融合发展催生了虚假信息、偏见歧视甚至意识渗透风险;三是数据安全,人工智能训练所需的海量数据在采集、使用、分析过程中,存在着数据泄露、篡改和真实性验证等安全隐患。
面对以上挑战,全球AI发展呈现政策法规先行、监管趋严等特征,我国也正在积极规范引导新一代人工智能技术研发和转化。2023年7月,国家网信办联合多部委发布《生成式人工智能服务管理暂行办法》,对AIGC进行包容审慎和分类分级监管。此外,《人工智能法》已列入立法计划。随着法律法规不断完善,人工智能安全治理也将更为规范。
8、 安全可信需求催生技术创新机遇
人工智能安全、可信的发展之路任重道远,在解决AI风险的过程中催生出可解释AI、隐私计算、联邦学习等技术创新机遇。
其中,可解释AI通过解释算法决策、解决算法黑箱问题,提升算法透明机制,促进算法公平。隐私计算、联邦学习等技术则通过加密和隐私保护技术来保障数据安全共享,打破数据孤岛。
产业协同:助力AI高质量发展
9、 开源创新将是AGI生态建设的基石
开源,即开放源代码。代码开源后,开发者可以公开获取版权限制范围内的模型源代码,并进行修改甚至重新开发。开源的自由度越高,越有利于吸引更多开发者参与到生态建设中。
AGI强调人工智能的通用性,意味着其生态需满足大量细分场景和长尾需求。这种情况下,开发者越活跃,生态系统越繁荣开放,越能覆盖更多专用化、场景化乃至碎片化的需求。
我国长期强调构建“开源”创新体系,部分企业已积极参与开源建设,助力构建我国AGI生态基石。
联想之星所投企业百川智能即是其中之一。自2023年4月成立以来,百川智能接连发布Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。其中,Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅,累计下载量超过六百万次。
10 、MaaS将是AGI生态构建的核心
模型即服务(MaaS)指大模型厂商将预训练模型开源,形成可调度、可管理、标准化API,从而按照API调用量来收费、按照产出内容收费或软件订阅收费、按照模型租赁收费等,旨在降低算法需求侧的开发技术和使用成本门槛。
MaaS模式下,需求侧用户可以专注自身业务逻辑和使用体验,而不必关注底层技术细节。而在供给侧,有望形成“通用大模型+领域大模型+行业大模型+企业/个人小模型”业态,推动AI落地千行百业,最终实现通用人工智能。