服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

金融业需要什么样的大模型?

日期: 来源:数科社收集编辑:数科社


导语:通用大模型走向行业大模型的适配之战。

出品丨数科社

作者丨林木

电影《奥本海默》里有句台词:(原子弹)不是一种新武器,而是一个新世界。这句话用来形容过去一年大模型的“爆炸”发展再恰当不过。

自ChatGPT发布以来,大模型成为整个人工智能的新底座,激起了新一波技术革命浪潮。在不到一年的时间里,通用大模型的爆发开始席卷各行各业,金融业作为数字化需求强烈的数据密集型行业,成为大模型率先落地发力的最优场景之一。

这个9月,金融大模型翻涌的海浪上又多了两个重量级新玩家。

9月8日,蚂蚁集团在上海外滩大会发布了工业级金融大模型(AntFinGLM),同时推出了两个配合模型层的产业应用“支小宝”和“支小助”。12天后,同在上海,华为首发了包括AI for Data、AI for Business、AI for IT三大类10个场景的金融大模型方案。

随着金融业新世界的大门开启,金融、科技巨头们不断涌入,一场从通用大模型走向行业大模型的适配之战也随之打响。

金融业到底需要什么样的大模型?通用大模型从通识阶段走向专识阶段,又将面临着哪些挑战?

01丨一个认知能力的引擎

近年来,拥抱数字化和新技术一直是金融行业反复强调和推动的重要命题。

某种角度来看,金融是一个特殊的信息处理行业,因而随之信息技术的快速更迭,金融领域所涉及到的功能、要素、产品和市场也会发生内在潜移默化的改变。

回顾过去十年的行业发展轨迹,互联网金融的出现,让辨别式AI在智能营销、智能风控、智能投研、智能客服等金融领域落地生花。基于机器学习驱动的建模能力不断赋能金融产业链的变革与创新,同时也为人工智能的渗透融入打下根基。

金融业对大模型并不陌生,生成式AI的横空出世,意味着行业新一轮AI革命浪潮已经到来。

“大模型已经不单单是一个知识的容器,它更成为一个认知能力的引擎。”9月8日,复旦大学教授、博导、上海市数据科学重点实验室主任肖仰华在外滩大会上,分享了对于通用大模型在适配和优化层面的思考。

肖仰华表示,今天的大模型已经非常擅长解决以前人工智能会碰壁的语言理解等常识类问题,甚至还具备了一定的自识反思能力和泛化组合能力,“我们不仅仅把大模型当做一个某类数据处理的基础模型,已经把它当作未来适应复杂环境的自治智能体的一个大佬。”

在他看来,这些能力恰恰是行业的认知所需要的,今天一个通用语料训练出来的大模型,已经成为行业垂语认知的一个重要基座。如金融领域的智能解决方案,过往思路是收集整个行业的数据来构建,整个关注点仍在于行业数据和知识,但大模型却是颠覆了这一认知。

肖仰华以医生诊断疾病举例,一个医生想胜任他的工作,首先要认知什么是健康,“我们发现其实行业的很多问题恰恰是建立在通用的认知能力基础上。”因此他认为大模型亦是如此,通用认知的理解非常重要,没有通识能力,是不可能发展出专业认知能力的。

当下已由感知智能转换到认知智能的大模型显然已具备了这一条件。相比以识别能力为主的传统AI模型,生成式AI的认知智能体现在理解、分析和决策三个维度上。

比如,它可以通过前文来预测下一个词语,对文本中不同的词语赋予不同的权重值,能够在生成文本时综合考虑到文本中的上下文关系,生成更连贯、合理的文本,赋予了其内容生产能力。这就注定了其会在智能交互环节大放异彩。

此外,生成式AI还可以从已有数据中学习样本的统计特征,并在此基础上生成新的数据,这种增强学习的过程,对于金融领域的智能投顾、风险控制等都无异于一种新的驱动力。

数据训练是大模型提升性能不可或缺的重要一环,OpenAI 团队所提出的大模型遵循的“伸缩法则”指出,当参数规模增加、数据集规模增加并延长模型训练时间,大模型的性能就会提升,并且如不受其他两个因素制约时,大模型性能与每个单独的因素都呈现幂律关系。

作为数据密集型行业,金融业沉淀了如金融交易数据、客户信息、市场分析、风控数据等海量数据,又催生出大量高效处理的技术需求。因此,大模型落地金融业,无疑是一场双向奔赴。

02丨还有“最后一公里”要走

尽管大模型的问世带给诸多行业巨大的想象空间,但当下对于金融业而言,通用大模型拿来就可用吗?答案显示是否定的。

在肖仰华看来,金融领域的本质是一类复杂决策,远远比开放闲聊的任务要困难得多,“你会发现通用模型里面的专业知识是远远不够的,通用大模型好比是一个夯实的知识底座,宽广有余,但纵深不足。”

除了专业力上的欠缺,肖仰华还提到一个非常值得关注的问题,即大模型“幻觉”——指大模型在生产内容的过程中,可能会由于训练语料及模型的原因,产生事实性的错误。

“行业中经常是希望大模型按照给出的规范、制度、文档回答问题,而不是从通用领域习得的知识回答问题,从技术上是叫Closed QA,而不是Open QA。”他认为,正是因为大模型擅长发挥创造,就很有可能跳出给定的内容去胡编乱造,缺乏领域的忠实度。

当下来看,这种“幻觉”无疑是通用大模型落地部分行业的障碍之一,尤其像数据敏感度较高的金融领域。

为了解决这一问题,OpenAI采取的做法是通过加强迁移学习和对抗训练,以提高回答的准确性和靠程度,GPT-4的内容准确性比GPT-3.5已增高了40%。而行业中的常见方法是通过对模型进行领域知识的微调,利用更加精确的数据来纠正模型的偏差,也就是构建垂直领域模型。

肖仰华给出的应对思路在于注重大模型和相关技术的协同。他表示,在大模型协助下,行业中很多任务被分成提示、生成、评估三个子任务,大模型主要在生成阶段发力,而在提示和评估阶段,仍有很多传统系统发挥价值的余地。

譬如知识图谱技术,图谱中的知识往往擅长表达的是专业知识、私密知识,和可理解、可控的符号知识,它和大模型所表达的恰成一种紧密的互补关系。利用知识图谱做事后评测、验证以及增强提示,可以进一步改善大模型的“幻觉”问题。

这种应对思路在当前一些重量级金融大模型身上已然被验证,如蚂蚁的金融科技团队过去几年在构建金融知识图谱上做了大量投入。

以支小宝团队为例,首先基于一些研报、新闻、大V资讯以及高质量权威合作数据源和数据库,通过合作的专家,对于领域专业知识进行了提炼和萃取,形成了一个标准化基础知识层。然后算法工程师再在此基础上做关联和整合,尝试建构金融现象之间的因果逻辑,最终匹配金融专业要求的知识图谱得以形成。

肖仰华表示,要把通用大模型的适配和优化当成一个系统工程,从数据层面、知识层面、架构层面、评估评测层面、生态体系等各个方面去寻找思路解决问题,“我们仍然有漫长的路要走,才能走完这最后的一公里。”

03丨风起云涌的适配之战

眼下,大模型从通识阶段走向专识阶段才刚刚迈出一小步,这个落地过程必然少不了金融机构与金融科技巨头的涌入、实践和推动。

目前来看,大模型技术发展先行一步的海外市场,从金融垂类大模型的构建,到将如信息管理、智能推荐、 细分领域问答等各个金融场景的应用,已有多个成功落地赋能行业的案例。

作为首个金融垂类大模型,BloombergGPT在3月的发布,为金融大模型的适配之战打响了第一枪。国际金融服务巨头Morgan Stanley(摩根士丹利)和 OpenAI 合作推出了一款基于 GPT-4 技术的聊天机器人,并利用该机器人管理其面向客户的庞大知识库。

在智能投顾领域, OpenAI 向 ChatGPT Plus 用户开放的用于投资的第三方插Portfolio Pilot,能帮助用户更加清晰的了解自己的投资组合,并获得投资建议。Broadridge 子公司 LTX 推出的 BondGPT,能帮助客户回答各种与债券相关的问题,还能根据特定数据筛选输出可视化图表。

回过头再来看开启“千模大战”的国内市场,在金融大模型的落地脚步同样响应迅速。半年时间,一众传统金融机构、金融科技巨头和互联网大厂纷纷躬身入局。相关统计数据显示,目前国内参数在10亿规模以上的大模型数量已有116个,其中金融行业大模型约18个。

从模型训练的参数量来看,国内不乏一些“千亿级”玩家:度小满开源的轩辕大模型,在1760亿参数的Bloom大模型基础上训练而来;恒生电子的Light-GPT利用了超过4000亿个Token的金融领域数据;蚂蚁金融大模型囊括的金融语料更是超过了5000亿。

互联网大厂与金融科技巨头多深耕人工智能领域已久,在技术落地应用上无疑占据着先发优势,如自带“安全基因”的蚂蚁和360,在对抗黑灰产和可信AI研究领域有着多年经验和投入。

此外,也有像华为、马上消费、星环科技这种“另辟蹊径”布局金融领域大模型的玩家。华为依托于盘古大模型,以金融级PaaS解决方案的方式切入金融场景;马上消费的天镜大模型则凭借着“三纵三横”技术布局扎根金融行业全链路;数据库厂商星环科技在自研金融大模型“无涯Infinity”的同时,还提供了一站式的企业自建大语言模型工具链,尝试两条腿并行。

9月19日,国内首个金融行业大模型标准在南京正式发布。该标准由中国信通院牵头,联合腾讯云、奇富科技、科大讯飞等四十多家企业共同编制,不仅涵盖了金融大模型的关键能力要求,还详细规定了其在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。

不难看出,在政策加持和企业助推之下,金融大模型的适配之路越发明朗,正从一小步变成一大步。

相关阅读

  • 第二届广州·琶洲算法大赛圆满收官

  •   第二届广州·琶洲算法大赛颁奖典礼暨算法产业大会在广州琶洲举行。  中国小康网 讯 记者麦婉华 9月26日,第二届广州·琶洲算法大赛颁奖典礼暨算法产业大会在广州琶洲举
  • 邬贺铨院士:人工智能赋能新一代信息技术创新

  • 中国网/中国发展门户网讯 (记者马骅)“大算力突破了算法的演进瓶颈,人工智能赋能了新一代信息技术创新,带动了技术革命的加速。数字经济实际上也是工业经济的一种形式。”中国工
  • 汇聚金融力量 共创美好生活

  • 国家金融监督管理总局雅安监管分局工作人员积极向群众普及金融知识  根据统一安排,9月26日,由国家金融监督管理总局雅安监管分局牵头,中国人民银行雅安市分行、市中级人民法
  • 新疆实现两级快递行业党委全覆盖

  •  天山网讯(记者 范琼燕报道)9月27日,记者从新疆邮政管理局了解到,在新疆邮政管理系统的共同努力下,自治区、地(州市)两级15个快递行业党委全部成立,基本形成“1个省级快递行业党委+
  • AI 领域:近期的技术亮点和投资机会

  • 编者按:人工智能技术的发展日新月异,有很多人工智能领域的初创公司脱颖而出。在本文中,让我们看看红杉资本和凯鹏华盈等公司的投资者选择了哪些有前途的人工智能初创公司。本文
  • 山西金融“五进入”加强金融消保教育

  • 9月26日,按照国家金融监督管理总局山西监管局的统一部署,省内各金融机构以“汇聚金融力量 共创美好生活”为主题,开展进农村、进社区、进校园、进企业、进商圈的金融“五进入”

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 金融业需要什么样的大模型?

  • 导语:通用大模型走向行业大模型的适配之战。出品丨数科社作者丨林木电影《奥本海默》里有句台词:(原子弹)不是一种新武器,而是一个新世界。这句话用来形容过去一年大模型的“爆炸
  • 国风雅韵 乐享中秋

  • 中秋节是我国的传统节日,佳节来临之际,9月27日,河北联邦幼儿园举办了“国风雅韵 乐享中秋”亲子游园活动。在活动入口处,孩子们和家长一起将美好的祝福与愿望写在了福签和心愿墙
  • 第二届广州·琶洲算法大赛圆满收官

  •   第二届广州·琶洲算法大赛颁奖典礼暨算法产业大会在广州琶洲举行。  中国小康网 讯 记者麦婉华 9月26日,第二届广州·琶洲算法大赛颁奖典礼暨算法产业大会在广州琶洲举
  • 以典型作先导 让文明与旅游同行

  • “文明是最美的风景”,文明旅游已经成为风景线上的新亮点。以典型作先导,可以让游客走上旅途便走进美好,与美丽风景做伴,让文明与旅游同行近日,文化和旅游部市场管理司发布通知,公