傅盛：企业应该选什么样的大模型？

阅读评论点赞

　　在当今这个充满变革的时代，人工智能正以前所未有的速度推动着各行业的发展。而在这一变革中，大模型扮演着至关重要的角色。但企业在选择大模型时，往往会陷入困惑，是参数越大越好吗?企业应该选择什么样的大模型呢?猎豹移动董事长兼CEO、猎户星空董事长傅盛给出了他的见解。

　　在猎户星空为企业应用大模型做服务过程中，有客户就询问能不能帮助做私有化部署。比如其中一家是某地方的政务客户，主要是希望通过AI大模型服务老百姓，回答诸如公积金、社保等问题。因为涉及到数据安全，对于使用公有大模型心怀疑虑。

　　在不少人看来，大模型参数越大，智能效果越好，千亿参数大模型自然比小参数量的大模型更好用。但是，一个千亿参数大模型一年私有化授权费用动辄几千万。如果用它私有化部署以后，光买服务器让他跑起来，最低成本就要160万元。客户们使用大模型，原本的目标就是降本增效。如果，光部署服务器就需要巨大的费用，这显然与初衷背道而驰。

　　“我们其实就想用大模型做一个客服，一年要投个几千万那划不来。”客户的负责人反馈说，再高深的技术，最后都得算账，有没有又便宜又不损失性能的方案。

　　这也给了傅盛启发，千亿参数可以涌现智能，百亿参数可不可以呢?百亿参数的智能在有一些情况可不可用呢?

　　2023年2月，LLaMA的出现让instructiontuning(对指令进行调优，以改善技术系统的性能和效率)这个方向变得火热。3月，Alpaca又让大家看到从成熟的模型 distill(蒸馏，将大模型的学习结果，作为小模型的学习目标)小模型成为还不错的 ChatBot 的可能性，从而引发LlaMa系(羊驼系)模型寒武纪大爆发，小参数模型的性能快速崛起。而在一些评测级上，百亿参数在某一些能力上已经接近了GPT，千亿参数不再是唯一选择。

　　随着开源社区的出现，猎户星空也更加坚定了自己的思路，聚焦百亿参数，强化微调套件，结合自身服务能力，最终发现，用百亿参数的模型，加上客户的私有数据，再加应用的打磨，在专业领域问题的问答上，就可以达到甚至大于千亿参数大模型的结果。

　　傅盛认为，企业在选择大模型时，首先要考虑的是大模型的实用性。不能仅仅看其参数大小，更要关注其在实际应用中的效果。因为，只有真正能够解决企业实际问题的模型，才是有价值的模型。