首页 热点 要闻 国内 产业 财经 滚动 理财 股票

云启资本合伙人陈昱:AI大模型突破核心在工程优化,应用落地符合“二八定律” 世界热点评

2023-06-01 16:59:31 来源 : 21世纪经济报道

21世纪经济报道记者骆轶琪 广州报道


(相关资料图)

进入大模型发展时期,AI产业被视为进入了“iPhone时刻”甚至将来到“奇点”,诸多行业都将由此被改变。那么对于产业和个人来说,机会将在哪里?

近日举行的2023小蛮腰科技大会暨AIGC人工智能峰会期间,云启资本合伙人陈昱接受21世纪经济报道记者专访时表示,当前还在竞速中的国内AI大模型企业都有发展机会,核心在于不断提升工程优化和技术迭代能力,同时也要充分挖掘创新应用场景。

在他看来,生成式AI落地到应用场景中,将是80%存量应用升级+20%新应用探索的“二八定律”局面。也将给正在演进中的技术,如元宇宙、自动驾驶等,带来渐进式能力推动。

作为早期投资人,在面对AI大模型创业项目时,他看好有野心、懂技术、执行力强的团队。毕竟如今竞争对手众多,如果执行力不够,将很难在这一轮浪潮中跑出成果。据悉,2021年底,云启在天使轮投资的MiniMax,是国内第一家拥有自研多模态大模型的创业公司,目前已开放API接口,和WPS等众多企业合作。

竞速AI大模型

追根溯源,如今火爆全球的ChatGPT背后,是Transformer架构的支撑。这一技术早在2017年被谷歌提出,2018年谷歌还提出基于Transformer架构的BERT技术等。

“其实无论是早期的CNN(卷积神经网络)还是Transformer,都属于在深度学习领域,行业探索过程中寻求的不同网络结构。恰好Open AI用解码器decoder only架构,证明了Transformer的可行性,并把参数规模从十亿扩展到上千亿量级。”他续称,因此这一方面有赖于深度学习算法的持续发展;另一方面英伟达提供的GPU算力支持同样功不可没。

实际上,在早期路径探索中,谷歌认为decoder only路线可能会不如encoder+decoder(编码-解码)效果好,因此采用了另外一条路线,而谷歌内部长期有多个团队在做不同尝试。

最终Open AI持续迭代,加之RLHF(人类反馈强化学习)后,证明了decoder only路线的可行性。随着路线被证明,谷歌很快也推出号称可对标GPT4的大模型PaLM2。

“国内和国外有不同的大模型体系,投身AI大模型的国内企业,当前还是有一定机会。”陈昱对记者分析,目前GPT-4的水平可能已经达到了95分,国内很多产品在80分左右,但是并不存在代际差。

这时候更重要的是,一方面,AI大模型公司需要花费更多时间在工程优化和技术迭代上;另一方面,更需要产品经理的创新能力,充分挖掘AI大模型的创新功能。

“我觉得这一轮,微软在创新应用方面做得比绝大部分公司好,近期微软密集发布新功能,比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等,因此也有声音说,微软的一系列动作要抢了创业公司的饭碗。”他续称。

不过有行业观点认为,Open AI更多是证明了Transformer架构路线的可行性,在具体落地时,或许未必要重投入,而是可以考虑小模型发展路线。

“目前业界存在不同观点。”陈昱对记者分析,一部分人认为,小模型可能存在诸多优势,如资源消耗较少、成本低,而成本低就是跑通商业模型的重要一环;同时,当前“大力出奇迹”的AI大模型中集合了太多数据量和能力,但实际在应用中或许未必需要。

但另一部分人认为,AI公司最终的发展目标都是瞄准通用人工智能(AGI),也即类似人类的大脑,在运转过程中并不会分区,而是可以同时多路线思考运行,甚至各分区之间会互相作用,产生意想不到的效果。这条思路之下,就意味着需要大模型最终“一统江湖”。

总体来看,当前业界对这两条路仍有分歧。“学术上也还没有证明,大模型是否的确是参数量越多越好。毕竟目前AI的运作还是一个黑匣子。”

当然他也认为,并不是所有企业都需要有自己的大模型。“训练大模型要从头开始,这意味着巨大的资源消耗,需要衡量投入产出比。有时调用成熟的大模型,取得的效果可能远比自己从头搭建和训练要好。”他强调,长远来看,综合考虑成本和收益是否算得过来账很重要。

如何改变未来

当前最受关注的,便是在生成式AI浪潮之下,对应用生态和相关底层技术带来的影响。陈昱对记者分析,在应用场景落地中,将是80%存量应用升级+20%新应用探索的局面。

具体来说,数字经济、企业服务/SaaS服务等技术此前已经发展多年,通过引入更好的AI大模型能力,可以将既有技术进一步升级,把之前很难做好的体验真正做到满意;再如微软近期不断对旗下应用进行迭代升级,将极大提升内容生产力和工作效率。这都是由技术变革带来的体验变革。

当然也会诞生新的应用,比如这一轮生成式AI与前一轮预训练模型不同的是,已经能够处理多模态、多语言信息,这将可能给教育、外贸等产业带来新变化;此外,还将有面向开发者的AI解决方案(AI for Developers),可以帮助程序员编写代码、检查安全漏洞等。

生成式AI技术的出现,也将给正在迭代中的技术路线带来一定帮助,比如元宇宙和自动驾驶等。但这总体带来的将是渐进式改变,而非颠覆式驱动。

陈昱对记者分析,AIGC对元宇宙的推动将主要在于素材生成。“元宇宙前期会在这方面花费较多时间,AIGC就可以帮助提高素材生成效率、节省创意时间。”

不过这并不能起到根本性推动作用。“元宇宙一直难以大面积落地,是因为暂时没有刚需的应用场景。AR/VR被视为元宇宙的入口,但目前遇到的难题是,还没有一款眼镜达到可以长期佩戴使用的效果。”他指出。

对于自动驾驶的改善可以包括两方面:感知(perception)和规划(planning)部分。

此前自动驾驶功能运行时,传感器需要不断收集外部信息,进行标注。但有了AI大模型后,由于其具备zero-shot(零样本)能力,可能就不再需要具象到所有可能出现的物体样本进行标记。

而自动驾驶进程中,根据收集到的地图、实时视觉等信息后,该决策是加速、减速还是换道等,就可以运用到AI大模型的推理能力,这将会比现有自动驾驶所用模型做到更好的效果。

对云计算的变化,陈昱指出,AI相关服务用量将激增,短期内会利好英伟达,但长久以后,云厂商可能会发现,与其每年不断向英伟达下订单购买芯片,不如自己开发芯片或和其他芯片厂商合作。

“英伟达的强悍在于开发了一款相对通用的AI芯片,但如果云厂商明确了未来几年都会采用Transformer架构时,那么自己也可以考虑针对Transformer优化一款专有芯片,所以也看到包括谷歌、微软、Meta都有自己的芯片开发计划。”他续称。

AI大模型还在不断渗透到软硬件层面,如近期ChatGPT推出iOS版、百度为此推出硬件产品等。不过陈昱并不认为AI大模型的出现会对既有软硬件生态带来太大角色改变。

我认为改变的可能是搜索生态。”他续称,比如ChatGPT就可能成为谷歌在搜索方面的竞争对手。这意味着对用户使用习惯没有太大改变,改变的只是获取信息的途径。

从社会影响来说,陈昱认为,这将对整个教育体系带来巨变。可以类比此前计算机出现后,复杂的珠算、五位数乘法等学习,到今天多被计算器所取代,人们可以把脑力放在其他更有创造力知识的学习中去。“如果能够利用好AI工具,帮助我们人类完成此前80%的工作,剩下20%可以更好地施展创造力和想象力,同时也会带来新的职业畅想和组织范式。

关键词:
相关文章

最近更新
精彩推送