日期:
来源:中国新闻周刊收集编辑:中国新闻周刊
1月10日,在第五届百度Create AI开发者大会上,李彦宏分享了这样一幅画:被冰覆盖住的树杈上,两朵翠绿欲滴的苞芽破冰而出,右边的苞芽已伸出一片小小的叶子,下一秒似乎就要绽放。
这幅画出自AIGC技术应用分支之一,即AI作画之手。怎么生成的呢?其实是李彦宏以“危机和希望”为关键词,输入百度AI作画平台文心·一格后,由AI自动生成。这幅画不仅传神,还有哲学意味。“冰”寓意危机,“苞芽”寓意希望,危机中有希望,希望中也有危机。李彦宏将其比作企业成长,他说:“所有伟大的企业、伟大的创造者也是一样,没有一帆风顺,只有不断地历经困难再凯旋。困难会刺激创新,而创新是增长的真正动力。”这句话,也非常适用于当前火爆的AIGC领域。自去年以来,以AI作画为代表,AIGC领域新故事不断。AIGC也被Science杂志评为2022年度科学十大突破。2022年被称为AIGC元年。去年,《太空歌剧院》画作激起了大众对AI作画的关注。这幅画在8月的美国科罗拉多州博览会艺术比赛中,一举摘得数字类别冠军。单从画面看,这幅画很有冲击力和未来感,画面中有歌剧表演,还有一个似乎连接另一个世界的圆窗。引发争议的是,这幅画是游戏设计师杰森·艾伦使用AI绘图工具Midjourney生成,再经Photoshop润色而来。有人认为,AI作品参赛对其他人类画家不公,也有人认为是技术与艺术的创意融合。#AI画作拿一等奖惹怒艺术家#话题在国内引发超亿关注一时间,相关话题也在世界范围内引发激烈讨论。与此同时,社交平台上更是刮起一股“驯服”AI之风,让AI作画真正“破圈”。AI作画让背后的AIGC浮出水面。AIGC是AI Generated Content缩写,即利用AI技术自动生成内容的生产方式,对应互联网 UGC(用户生成内容)、PGC(专业生产内容)等概念。AIGC不仅可以作画,还可用于图文、语音、音频、视频等多类型内容创作。去年11月,人工智能公司OpenAI发布的聊天机器人模型ChatGPT上线后,更是给炙手可热的AIGC再添一把火。它可以和人类对话,甚至可以写小说、写代码、回答科学问题等,开放五天即收获超百万用户。与此同时,AIGC也受到资本青睐,AIGC公司纷纷获得巨额融资。国内外互联网巨头也加速布局。在国外,谷歌、Meta、微软等从文字、图画、视频方面加码。在国内,百度在去年8月就已发布AI作画平台文心·一格。基于技术创新,用户只需输入文字,选择画风,即可迅速生成一幅画。早在去年7月的百度世界大会上,李彦宏就判断,未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。其实在这之前,在去年全国两会期间,有媒体就依托百度AIGC技术的数字人主播度晓晓,在代表通道、委员通道及正能量话题方面进行报道,引发关注。李彦宏的这一研判,更是让AIGC备受各界关注。同年9月,红杉合伙人Sonya Huang、Pat Grady与生成式AI预训练模型GPT-3共同创作完成《生成式AI:一个创造性的新世界》文章,激起资本对“新世界”的想象。正如李彦宏所研判,当前AIGC在各领域开花,从助手走向协作乃至原创。市场对AIGC的经济价值也有很高期待,而绘画、音乐、新闻创作、主播等诸多行业或将被重新定义。AIGC火爆并非偶然,背后其实是技术跃升的必然结果。从底层逻辑来看,AIGC就是AI从理解语言、文字、图片和视频,走向了自动生成内容。在百度看来,AIGC是“人机共创”新模式,随着技术突破,AI作画、AI创作视频,甚至构建虚拟世界,可能会变得像手机拍照一样简单。其实,早在2015年AI作画就在GAN(生成式对抗网络)概念模型迎来发展。但受限于技术,操作难度大、生成时间长,离大规模复制应用有很大差距。而随着NLP(自然语言处理)技术、视觉生成技术、AI深度学习能力等提升,以及相关模型广泛使用,AI作画逐渐走向简易化。技术突破,也让应用成为可能。同时,世界范围内,诸多企业更是争相竞逐AIGC。百度早在十年前就已铺垫AI实力,并较早布局AIGC,在技术方面,走出了“百度路径”,积累了独特实力,基于文心大模型,打造出了自己的内容生产模型“天团”。其中,文心ERNIE 3.0 Zeus是“编剧”,从百科、小说、新闻、戏剧、诗歌等无标注数据中学习,融入知识图谱,学着写摘要、对联,翻译、分类、阅读理解等。其在几十类自然语言理解和生成公开权威任务及零样本和小样本学习任务上处于世界领先水平。文心ERNIE-ViLG 2.0是“美术师”和“插画师”,能根据一句话或一段描述文本生成精美画作。百度提出知识增强扩散模型,在学习过程中引入语言、视觉等知识,指引模型更关注文本和图像核心语义元素,实现精准细粒度语义控制。此外,“剪辑师”和“动画师”也各有本领。视频生成大模型可根据描述文本或图像自动地生成高清、流畅的视频;视觉编辑方面,百度还研发VIMER-TCIR多任务大模型,通过对超分辨率、去噪、去模糊、去压缩等多任务联合预训练,实现多种不同情况修复和编辑,通过画质提升、边缘锐化等方式增强视频清晰度,达到全方位提升视频编辑效率和观感体验。据中国专利保护协会发布的《人工智能领域高价值专利分析报告》显示,中国AI技术发明专利价值、申请量、授权量排名中,百度均位列第一。作为AIGC技术支撑,百度的通用技术、语音技术、自然语言处理技术专利授权量和专利价值度排名第一,视觉技术专利授权量和专利价值度排名领先。预训练大模型是人工智能发展重要方向,百度文心已累计发布11个行业大模型,其内容生成能力极大地促进了AIGC发展。今年的Create AI开发者大会上,百度的AIGC技术深入应用到大会歌曲、场景、演讲脑图等创作中李彦宏提到,2022年是大模型产业化应用元年,大模型已成为许多上层应用的技术底座。百度其实已描绘很多变革图景:百度数字人度晓晓发布MV《启航星》,作画、作词、作曲全部由AI操刀;度晓晓挑战写高考作文,40秒写40篇,据说得分排在总考生前25%;文心·一格更是公开多项AIGC专利,解决需求描述困难、多样化需求强、模型生成结果筛选难问题;百度APP里有些视频内容是AI把百家号的图文内容自动转换成视频的结果……通过在深度学习平台、大模型等底层技术上的积累,对人工智能发展趋势的前瞻性布局,百度抢占先机,已成为全球AIGC发展领导者之一。AIGC被认为是技术领域新变革的开始。虽然AIGC热度高涨,但距离实现产业化、商业化还有很多路要走,还需在探索中共寻解决方案,共建健康生态。万事开头难,其实任何技术发展都是如此。去年的Create大会上,李彦宏曾提到,随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。今年,李彦宏再次提到,这些发展的方向是明确的,但实现的过程却不会容易,甚至会非常困难非常有挑战。他说,这就是技术发展的特点。技术战略,意味着长周期,而长周期不可能一帆风顺。长周期就需要长期主义,就需要死磕到底的精神。23年前,李彦宏回国创业时,两个月后,就遇到互联网泡沫破裂,全世界蒸发8万亿市值,很多人被困难动摇了信心,选择放弃、选择离开。最后是坚持挺过寒冬的人,成就了互联网发展的黄金十年。他认为,人工智能从今天走向未来的过程中,这样的起起落落还会发生。而百度形成的“反馈驱动创新”模式或许可以带来一定启示。百度是全球为数不多进行全栈布局的人工智能公司,从芯片层、框架层、模型层到应用层进行全面布局,同时百度坚持在创新中收集反馈,在反馈中创新。比如昆仑芯片在AI芯片中性能非常领先,正是因为已为百度搜索服务优化十年;萝卜快跑自动驾驶出行服务订单量持续增加,正是由于不断获得市场和用户反馈,不断进行优化的结果。这一模式像动力引擎推动百度持续向前。从高端芯片昆仑,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有百度的关键自研技术,而每一层都有很多反馈,通过不断获得反馈,从而实现端到端优化。李彦宏清醒地看到,实体经济很多领域的数字化改造尚未完成,数字化本身并未带来效率明显提升。智能化广泛渗透还需要时间,智能化对实体经济的巨大拉升作用还没成为广泛共识。他认为,人工智能的商业化还需在黑暗中摸索一段时间。一直在摸索中前进的百度,对AI的布局其实都很实在。技术的突破是根本,而人才的投入是未来。李彦宏提到,三年前,百度宣布五年内为社会培养500万AI人才,目前已培养超300万。他还表示,未来会投入更多资源,为中国AI的发展尽最大努力。当前,百度已与全国100 多所高校进行深度人才培养战略合作,共同培养创新实践型AI人才。花大力气培养未来人才,这是一家科技企业对于未来的投资,是科技企业应有的精神内核及责任担当。2022百度之星大赛最小决赛选手王茂骅。据介绍,百度连续八年支持教育部产学合作协同育人项目;持续举办百度之星程序设计大赛、“一带一路”国际大数据竞赛、中国高校计算机大赛-人工智能创意赛(C4-AI大赛);百度奖学金已累计颁发超1900万在今年的百度Create AI开发者大会上,我们看到AIGC丰富的应用场景,这场被称为“人机共创”的大会,带来了一场技术盛宴。虽然AIGC的未来面临诸多挑战,但正如李彦宏分享的那幅画,“困难会刺激创新,而创新是增长的真正动力。”相信随着越来越多像百度一样踏实的探索者出现,AIGC将充满更多想象。
作者:郭盼盼
编辑:马敏
运营编辑:马晓轶