云启资本合伙人陈昱：AI大模型突破核心在工程优化，应用落地符合“二八定律” 世界热点评

2023-06-01 16:59:31 来源 : 21世纪经济报道

21世纪经济报道记者骆轶琪广州报道

(相关资料图)

进入大模型发展时期，AI产业被视为进入了“iPhone时刻”甚至将来到“奇点”，诸多行业都将由此被改变。那么对于产业和个人来说，机会将在哪里？

近日举行的2023小蛮腰科技大会暨AIGC人工智能峰会期间，云启资本合伙人陈昱接受21世纪经济报道记者专访时表示，当前还在竞速中的国内AI大模型企业都有发展机会，核心在于不断提升工程优化和技术迭代能力，同时也要充分挖掘创新应用场景。

在他看来，生成式AI落地到应用场景中，将是80%存量应用升级+20%新应用探索的“二八定律”局面。也将给正在演进中的技术，如元宇宙、自动驾驶等，带来渐进式能力推动。

作为早期投资人，在面对AI大模型创业项目时，他看好有野心、懂技术、执行力强的团队。毕竟如今竞争对手众多，如果执行力不够，将很难在这一轮浪潮中跑出成果。据悉，2021年底，云启在天使轮投资的MiniMax，是国内第一家拥有自研多模态大模型的创业公司，目前已开放API接口，和WPS等众多企业合作。

竞速AI大模型

追根溯源，如今火爆全球的ChatGPT背后，是Transformer架构的支撑。这一技术早在2017年被谷歌提出，2018年谷歌还提出基于Transformer架构的BERT技术等。

“其实无论是早期的CNN（卷积神经网络）还是Transformer，都属于在深度学习领域，行业探索过程中寻求的不同网络结构。恰好Open AI用解码器decoder only架构，证明了Transformer的可行性，并把参数规模从十亿扩展到上千亿量级。”他续称，因此这一方面有赖于深度学习算法的持续发展；另一方面英伟达提供的GPU算力支持同样功不可没。

实际上，在早期路径探索中，谷歌认为decoder only路线可能会不如encoder+decoder（编码-解码）效果好，因此采用了另外一条路线，而谷歌内部长期有多个团队在做不同尝试。

最终Open AI持续迭代，加之RLHF（人类反馈强化学习）后，证明了decoder only路线的可行性。随着路线被证明，谷歌很快也推出号称可对标GPT4的大模型PaLM2。

“国内和国外有不同的大模型体系，投身AI大模型的国内企业，当前还是有一定机会。”陈昱对记者分析，目前GPT-4的水平可能已经达到了95分，国内很多产品在80分左右，但是并不存在代际差。

这时候更重要的是，一方面，AI大模型公司需要花费更多时间在工程优化和技术迭代上；另一方面，更需要产品经理的创新能力，充分挖掘AI大模型的创新功能。

“我觉得这一轮，微软在创新应用方面做得比绝大部分公司好，近期微软密集发布新功能，比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等，因此也有声音说，微软的一系列动作要抢了创业公司的饭碗。”他续称。

不过有行业观点认为，Open AI更多是证明了Transformer架构路线的可行性，在具体落地时，或许未必要重投入，而是可以考虑小模型发展路线。

“目前业界存在不同观点。”陈昱对记者分析，一部分人认为，小模型可能存在诸多优势，如资源消耗较少、成本低，而成本低就是跑通商业模型的重要一环；同时，当前“大力出奇迹”的AI大模型中集合了太多数据量和能力，但实际在应用中或许未必需要。

但另一部分人认为，AI公司最终的发展目标都是瞄准通用人工智能（AGI），也即类似人类的大脑，在运转过程中并不会分区，而是可以同时多路线思考运行，甚至各分区之间会互相作用，产生意想不到的效果。这条思路之下，就意味着需要大模型最终“一统江湖”。

总体来看，当前业界对这两条路仍有分歧。“学术上也还没有证明，大模型是否的确是参数量越多越好。毕竟目前AI的运作还是一个黑匣子。”

当然他也认为，并不是所有企业都需要有自己的大模型。“训练大模型要从头开始，这意味着巨大的资源消耗，需要衡量投入产出比。有时调用成熟的大模型，取得的效果可能远比自己从头搭建和训练要好。”他强调，长远来看，综合考虑成本和收益是否算得过来账很重要。

如何改变未来

当前最受关注的，便是在生成式AI浪潮之下，对应用生态和相关底层技术带来的影响。陈昱对记者分析，在应用场景落地中，将是80%存量应用升级+20%新应用探索的局面。

具体来说，数字经济、企业服务/SaaS服务等技术此前已经发展多年，通过引入更好的AI大模型能力，可以将既有技术进一步升级，把之前很难做好的体验真正做到满意；再如微软近期不断对旗下应用进行迭代升级，将极大提升内容生产力和工作效率。这都是由技术变革带来的体验变革。

当然也会诞生新的应用，比如这一轮生成式AI与前一轮预训练模型不同的是，已经能够处理多模态、多语言信息，这将可能给教育、外贸等产业带来新变化；此外，还将有面向开发者的AI解决方案（AI for Developers），可以帮助程序员编写代码、检查安全漏洞等。

生成式AI技术的出现，也将给正在迭代中的技术路线带来一定帮助，比如元宇宙和自动驾驶等。但这总体带来的将是渐进式改变，而非颠覆式驱动。

陈昱对记者分析，AIGC对元宇宙的推动将主要在于素材生成。“元宇宙前期会在这方面花费较多时间，AIGC就可以帮助提高素材生成效率、节省创意时间。”

不过这并不能起到根本性推动作用。“元宇宙一直难以大面积落地，是因为暂时没有刚需的应用场景。AR/VR被视为元宇宙的入口，但目前遇到的难题是，还没有一款眼镜达到可以长期佩戴使用的效果。”他指出。

对于自动驾驶的改善可以包括两方面：感知（perception）和规划（planning）部分。

此前自动驾驶功能运行时，传感器需要不断收集外部信息，进行标注。但有了AI大模型后，由于其具备zero-shot（零样本）能力，可能就不再需要具象到所有可能出现的物体样本进行标记。

而自动驾驶进程中，根据收集到的地图、实时视觉等信息后，该决策是加速、减速还是换道等，就可以运用到AI大模型的推理能力，这将会比现有自动驾驶所用模型做到更好的效果。

对云计算的变化，陈昱指出，AI相关服务用量将激增，短期内会利好英伟达，但长久以后，云厂商可能会发现，与其每年不断向英伟达下订单购买芯片，不如自己开发芯片或和其他芯片厂商合作。

“英伟达的强悍在于开发了一款相对通用的AI芯片，但如果云厂商明确了未来几年都会采用Transformer架构时，那么自己也可以考虑针对Transformer优化一款专有芯片，所以也看到包括谷歌、微软、Meta都有自己的芯片开发计划。”他续称。

AI大模型还在不断渗透到软硬件层面，如近期ChatGPT推出iOS版、百度为此推出硬件产品等。不过陈昱并不认为AI大模型的出现会对既有软硬件生态带来太大角色改变。

“我认为改变的可能是搜索生态。”他续称，比如ChatGPT就可能成为谷歌在搜索方面的竞争对手。这意味着对用户使用习惯没有太大改变，改变的只是获取信息的途径。

从社会影响来说，陈昱认为，这将对整个教育体系带来巨变。可以类比此前计算机出现后，复杂的珠算、五位数乘法等学习，到今天多被计算器所取代，人们可以把脑力放在其他更有创造力知识的学习中去。“如果能够利用好AI工具，帮助我们人类完成此前80%的工作，剩下20%可以更好地施展创造力和想象力，同时也会带来新的职业畅想和组织范式。”

关键词：