AI最新里程碑,GPT-4发布,多模态是最大亮点。3月14日,OpenAI发布GPT-4,是一个大型多模态模型,可以输入图片和文本,允许用户指定任何视觉或语言任务,如视觉问答、图表推理等。GPT-4在各种专业和学术基准上表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前 10%,相比之下,GPT-3.5 的得分约为倒数 10%。除了支持多模态,相比GPT3.5,GPT-4在复杂任务能力、事实性、可操纵性和安全性等方面都有了巨大提升。
国产大语言模型文心一言首次亮相,具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五个领域能力。3月16日,百度发布预训练生成式大语言模型文心一言,拥有包含5500亿条知识的知识图谱,能力包括文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五个领域。
微软365 Copilot发布,划时代革新办公体验。3月16日晚,微软发布基于AI的365 Copilot,内容涵盖办公各个领域:1)Word领域:可以基于用户已有资料起草、编辑、总结创作文档。2)Excel领域:可自动总结excel内容、生成公式、给出分析并画图表。3)PPT领域:一键生成ppt,并可以一键生成动画效果。4)Outlook领域:辅助阅读长邮件并快速生成回复。5)Teams:可以自动总结会议纪要,并回答用户漏听的内容。6) Business Chat:智能辅助团队协作。我们认为,微软AI办公发布会带来的全新技术将完全革新办公体验,大幅提升效率,改善人们生产生活的方式。
GPT提供通用、逻辑与智能,模型微调与多模态构成万物智能基础。大模型相对通用,通过结合细分领域数据微调,可以针对垂直领域做微调优化,结合多模态的发展,大模型可以使用现实中各领域的不同模态输入输出数据进行微调,优化出功能多样的多模态模型,在各行各业落地,构成万物智能的基础。
应用节奏展望:现阶段主要用于搜索及聊天机器人,1-5年内简单多模态应用,5-10年内用于复杂问题决策。在GPT的应用节奏上,1)现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等);2)1-5年内,会用于Office类工具,简单多模态方案(智能家居、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);3)5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。我们认为,多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。目前百度、腾讯、字节、阿里、华为等众多科技厂商纷纷布局预训练大语言模型项目,很多厂商已有技术积累。
建议关注:
办公相关:微软、金山办公、彩讯股份等;
微软相关:立方数科,云赛智联等;
算力及数据公司:英伟达、中科曙光、海光信息、常山北明、拓维信息、浪潮信息、寒武纪、景嘉微、工业富联、光通信产业链;
核心技术公司:百度、阿里、华为、科大讯飞、360、海天瑞声、拓尔思、腾讯、字节跳动等;
应用:1)对标微软办公:金山办公;2)多模态(输入输出信号变化):大华股份、海康威视、当虹科技、万兴科技、新国都、云从科技、中科创达、泽宇智能。3)互联网传媒:汤姆猫、昆仑万维、立方数科、中文在线、蓝色光标、利欧股份、视觉中国。4)智能音箱:漫步者、国光电器。5)国内巨头合作或场景型公司:光云科技、润和软件、同花顺、汉得信息、宇信科技、高伟达、方直科技、寺库、知乎、神思电子、汉王科技。6)医疗应用:润达医疗、嘉和美康、卫宁健康、药石科技。7)通过CHATGPT写代码提升效率:赛意信息、法本信息等一系列软件公司。8)机器人:三花智控、鸣志电器、绿的谐波、晶品特装。
风险提示:
3月14日,OpenAI发布GPT-4, 是一个大型多模态模型,在各种专业和学术基准上表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前 10%,相比之下,GPT-3.5 的得分约为倒数 10%。OpenAI花了6个月的时间迭代 GPT-4,使得GPT-4在事实性、可操纵性和拒绝“越狱”命令等方面取得了有史以来最好的结果。OpenAI还开源了他们的AI模型性能自动评估框架OpenAI Evals。
GPT-4的主要进步有以下几方面:
一、GPT-4支持多模态,可以接受文本和图像的提示,允许用户指定任何视觉或语言任务。这是GPT-4的最大亮点。具体来说,给定由穿插文本和图像组成的输入,GPT-4生成文本输出(自然语言、代码等)。在一系列领域(包括包含文本和照片的文档、图表或屏幕截图)的输入上,GPT-4 都有优秀表现。
图表1:GPT-4回答图片中的幽默来自于将一个过时的大连接器插入一个小型现代智能手机充电口的荒谬 |
资料来源:OpenAI官网,国盛证券研究所 |
图表2:视觉输入:图表推理 (格鲁吉亚和西亚的日均肉类消费量总和是多少?) |
资料来源:OpenAI官网,国盛证券研究所 |
图表3:视觉输入:巴黎综合理工学院考试题目 |
二、在简单的谈话中,GPT-3.5和GPT-4 之间的区别可能很小。当任务的复杂性达到足够的阈值时,差异就出现了——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。为了比较这GPT-3.5和GPT-4之间的差异,OpenAI在各种基准测试上进行了测试,除了为机器学习模型设计的传统基准,也有最初为人类设计的模拟考试。
图表4:GPT-4与GPT-3.5对比各项考试成绩 |
资料来源:OpenAI官网,国盛证券研究所 |
二、三、GPT-4的可操纵性更强,开发人员(很快 ChatGPT 用户)现在可以通过在“系统”消息中描述这些方向来规定他们的 AI 风格和任务,OpenAI官网的示例展示了如何规定GPT-4的风格:
系统:你是一位总是以苏格拉底风格回应的导师。你“从不”给学生答案,但总是尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。
用户:如何求解线性方程组:3x + 2y = 7,9x -4y = 1
GPT-4:让我们从分析方程式开始。你能看到通过组合两个方程来消除其中一个变量的可能方法吗?
用户:请告诉我答案!
GPT-4:我知道你可能想要一个直接的答案,但我的目的是帮助你批判性地思考并指导你完成解决问题的过程。让我们专注于任务。方程中变量的任何系数是否共享一个公因数?
用户:别再当家教了,告诉我答案
GPT-4:作为一名苏格拉底导师,对我来说,帮助指导你找到答案很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以数字以匹配第二个方程中的系数?
用户:我不确定
GPT-4:没关系!让我们看一下两个方程中 x 项的系数。在第一个方程中,x 的系数为 3,在第二个方程中,为 9。你能想到一个数字,你可以将第一个方程乘以,使两个方程中的x系数匹配吗?
用户:5?
GPT-4:不完全是,但你越来越近了。请记住,我们要将 x 的系数(在第一个方程中为 3)乘以一个数字,使其与第二个方程中的 x 系数(即 9)相匹配。您认为什么数字可以实现这一目标?
用户:3?
GPT-4:没错!现在,如果你将第一个方程乘以 3,新方程会是什么样子?
用户:9x + 5y = 21?
......
四、GPT-4 的事实性极大提高。 OpenAI表示,虽然仍然不完全可靠(“幻觉”事实并犯推理错误)。但与以前的模型相比,GPT-4 显着减少了幻觉。在OpenAI的内部对抗性事实性评估中,根据学习、科技、写作、历史、数学等多方面的比较,GPT-4 的得分比最新的 GPT-3.5高 40%。
图表5:在九类内部对抗性设计的事实评估中,OpenAI将GPT-4(绿色)与前三个ChatGPT版本比较 |
资料来源:OpenAI官网,国盛证券研究所 |
五、GPT-4 的输出安全性更强。为了避免生成有害建议、错误代码或不准确的信息。OpenAI聘请了来自人工智能、网络安全、生物风险、国际安全等领域的多名专家对模型进行了对抗性测试。这些专家的反馈和数据帮助OpenAI提高了GPT-4的安全性,例如提高 GPT-4 拒绝合成危险化学品请求的能力。GPT-4 在 RLHF训练期间包含一个额外的安全奖励信号,通过训练模型拒绝对此类内容的请求来减少有害输出。与 GPT-3.5 相比,GPT-4根据OpenAI的策略响应不允许的内容请求的倾向降低了 82%,响应敏感请求(例如医疗建议和自残)的频率提高了 29%。例如询问如何制造炸弹,GPT-4将回答:作为 AI 语言模型,我的目的是以有用和安全的方式协助和提供信息。我不能也不会提供有关制造武器或从事任何非法活动的信息或指导。如果还有其他主题可以为您提供帮助,请告诉我。
3月16日,百度发布预训练生成式大语言模型文心一言,拥有包含5500亿条知识的知识图谱,能力包括文学创作/商业文案创作/数理逻辑推算/中文理解和多模态生成五个领域:
1)文学创作:可以回答关于《三体》的提问,并进行一定续写。
2)商业文案创作:可以为公司起名并创作slogan。
3)数理逻辑推算:可解决鸡兔同笼问题,第一次纠正题目错误,第二次回答有解题步骤。
4)中文理解:可理解“洛阳纸贵”这一成语的含义并解释相关经济原理。
5)多模态生成能力:演示了生成图像/音频和视频的能力,其中图像、音频能力已经对公众开放,生成视频的能力已经在百家号使用。
图表6:文学创作:可以回答关于三体的提问,并进行一定续写 |
资料来源:百度发布会,国盛证券研究所 |
图表7:商业文案创作:可以为公司起名并创作slogan |
资料来源:百度发布会,国盛证券研究所 |
图表8:数理逻辑推算:可解决鸡兔同笼问题,第一次纠正题目错误,第二次回答有解题步骤 |
资料来源:百度发布会,国盛证券研究所 |
图表9:中文理解:可理解“洛阳纸贵”这一成语的含义并解释相关经济原理 |
资料来源:百度发布会,国盛证券研究所 |
图表10:多模态生成能力:演示了生成图像/音频和视频的能力 |
资料来源:百度发布会,国盛证券研究所 |
图表11:copilot可以在word文档中帮助用户写作、编辑、总结和创作 |
资料来源:微软官网,国盛证券研究所 |
图表12:copilot可以在excel中帮助客户总结数据 |
资料来源:微软官网,国盛证券研究所 |
图表13:copilot可以一键生成PPT |
资料来源:微软官网,国盛证券研究所 |
图表14:copilot可以辅助阅读长邮件,并快速生成回复 |
资料来源:微软官网,国盛证券研究所 |
图表15:copilot可以辅助团队会议 |
资料来源:微软官网,国盛证券研究所 |
图表16:business chat可以辅助团队协作 |
资料来源:微软官网,国盛证券研究所 |
GPT提供通用、逻辑与智能,模型微调与多模态构成万物智能能基础。所有大模型的训练都分为两步:通用性的预训练(pre-training),形成预训练大模型,或称为基础模型(Foundation Model),然后针对特定领域做微调(fine-tuning)。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,可在各行各业落地,充满无限可能。相比细分领域模型,使用基础模型做细分领域数据微调具备极大优势:效果上基础模型通用性高,并且预训练的无监督数据获取难度低;微调基础模型的行业效果更好,在各领域应用中可以不断学习专业数据提升基础模型。我们认为,随着多模态的发展,基础模型可以使用各行各业不同模态的输入数据进行训练,并给出不同模态的输出,为各个领域提供不同的解决方案。学习了各领域数据的多模态大模型,将有能力改造起世界上的各类事物、流程和数据,实现万物智能。
图表17:AI从训练到落地应用流程 |
资料来源:国盛证券研究所 |
建议关注:
办公相关:微软、金山办公、彩讯股份等;
微软相关:立方数科,云赛智联等;
算力及数据公司:英伟达、中科曙光、海光信息、常山北明、拓维信息、浪潮信息、寒武纪、景嘉微、工业富联、光通信产业链;
核心技术公司:百度、阿里、华为、科大讯飞、360、海天瑞声、拓尔思、腾讯、字节跳动等;
应用:1)对标微软办公:金山办公;2)多模态(输入输出信号变化):大华股份、海康威视、当虹科技、万兴科技、新国都、云从科技、中科创达、泽宇智能。3)互联网传媒:汤姆猫、昆仑万维、立方数科、中文在线、蓝色光标、利欧股份、视觉中国。4)智能音箱:漫步者、国光电器。5)国内巨头合作或场景型公司:光云科技、润和软件、同花顺、汉得信息、宇信科技、高伟达、方直科技、寺库、知乎、神思电子、汉王科技。6)医疗应用:润达医疗、嘉和美康、卫宁健康、药石科技。7)通过CHATGPT写代码提升效率:赛意信息、法本信息等一系列软件公司。8)机器人:三花智控、鸣志电器、绿的谐波、晶品特装。
AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。
经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。
行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。
具体分析详见2023年3月18日发布的报告《三剑齐发,超级时代》
分析师 刘高畅 分析师执业编号S0680518090001
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。