几乎所有券商都在对生成式AI做分层讨论,按照他们的分层逻辑,基础模型位于最底层,具体下游任务处在最顶层,中间层则是研究如何低成本使用基础模型。基础层已被看作是大厂的地盘,甚至大厂在这一领域的反应都略晚。初创潞晨科技的CEO方佳瑞曾在微信团队从事自然语言处理业务,他日前提到,即使是腾讯,在2021年都对大模型比较“麻木”,只有少数人感兴趣,而2022年一切生变,整个公司都开始重视。根据国盛证券的估算,ChatGPT的前身模型GPT-3训练一次成本约为140万美元;对于更大的语言模型,训练成本介于200万美元至1200万美元之间。不少投资人告诉记者,基础模型会是集中式的商业模式,大部分初创无法真正参与进来,最终更可能是国家实验室和高校结合输出。“基础模型的竞争是人才、算力以及数据三个维度的竞争。”金沙江张予彤直言。去年,界面新闻曾做出预判,ChatGPT的出场会加速AI领域的结构性调整。这基于去年AI领域风投于应用层布局有降温迹象,而底层建设和基础层的风投融资占比开始提升。而目前随着ChatGPT引发的算力瓶颈凸显,大厂又开始占据先天优势,AI领域的结构调整速度又进入不明确区间。“大厂已经开启布局,独立创业公司风险更高,因为对PE的风险偏好也是考验。”刘大卫直言。但少数门槛很高的基础层初创仍然被资本青睐。聚焦稀疏计算的AI芯片公司墨芯人工智能可以构建高算力低成本的AI计算平台,迄今为止完成了数轮融资。墨芯创始人王维曾表示,创业公司想要从垄断龙头口中夺食,来自底层技术的颠覆创新对性能的提升至少要达到10倍。能对底层模型进行管理优化的中间层也进入投资人视野,迅速在一年内完成两轮融资的潞晨科技就是其间明星,这家公司旨在让更多用户受益于大模型的能力。需要指出的是,目前创业公司有能力连通上下游,输出中间层know-how的很少,早期硬科技VC们的眼光也比较一致。真格基金押注了潞晨科技和墨芯,投资了潞晨的蓝驰创投还布局了西湖心辰,后者的创始人蓝振忠在大模型领域颇有影响力。在张予彤看来,一些传统的模型训练与推理的基础设施已经涌现,投资人在应用和基础层之外,还需要关注如何为大语言模型提供更好的开发者界面以及基础软件。当界面新闻询问数位投资人面对中间层强技术初创是否会投资时,并没有得到确定性答案。刘大卫表示前瞻性技术必须结合生态才更有意义。他告诉界面新闻,从投资回报角度,围绕生态来投更有意义,一个好的技术广泛被人应用才能真正产生价值,“扎克伯格为了推VR,每年拿5亿美金投给生态,对于很多细分产业链,如果究其竞争本质,技术本身可能不是最重要的。”蓝驰创投投资合伙人刘勇认为,应该更开放看问题,很多机器学习的分支也会随着ChatGPT浪潮涌现,“现在大家集中在大模型上讨论问题,像强化学习这个关键分支反而被忽略,这是短期内投资人就应该开始关注的方向。”上游应用层的情况则更为模糊,不论VC出手还是初创形态,百花齐放的局面还远未形成。红杉美国在去年9月给出了AIGC应用层完整图景,勾勒出了这个游戏的边界,但国内投资人对低垂的果实并不急切。一位头部美元基金投资人告诉记者,那些基于ChatGPT模型做的垂直应用,是否值得投资要看积累,赶热度的他们不会去投。去年9月,红杉美国官网发表的《Generative AI: A Creative New World》一文,首次对AIGC做出了业界极具影响力的预判,这是上游图景 图源:红杉刘勇认为,上游的初创会面临和大厂竞争,投资决策要看模型的核心能力和规模化的深浅,而这些在早期不好判断。“AIGC一定就在应用层嘛,有一天他们自己去训练一个垂直的模型,我一点都不吃惊啊。”刘勇所说的已经成为现实,AI图像生成公司Tiamat是目前细分赛道进程最快的初创之一,据界面新闻了解,这家上游公司就拥有自研的AI文生图大模型。“以前简单的chatbot(对话机器人)也有不错的公司出现,这种公司只要找对了场景,有用户愿意买单,也能赚很多钱。”刘大卫坦言,不论模式简单或者复杂,他都愿意去看,不过,公司在产业链的话语权对投资人做决策时更为关键。