腾讯的大模型“成品”终于来了
今年6月,在2023腾讯股东大会上,当被问及大模型进展时,马化腾曾说,“我们一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
如今虽迟但到,鹅厂终于也推出了自己的通用大模型。9月7日,腾讯在一年一度的全球数字生态大会上,正式“亮相”了自己的混元大模型。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍:混元大模型通过腾讯云对外开放,并已接入了腾讯广告、游戏、金融科技、腾讯会议、微信搜一搜等产品。
(资料图片)
汤道生表示,该大模型产品是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,将作为腾讯云MaaS服务的底座,支持API直接调用,以及专属大模型产品应用构建。
如今一个普遍行业共识是:大模型正在改变云生态。它有可能成为互联网云厂商在价格战之外谋求份额增长的新动力,并为云计算行业带来全新的变革契机。
而在今年以来,腾讯云在公有云业务(IaaS+PaaS)市场份额下降的现实基础上,抓住此次时机,也显得尤为重要。腾讯云总裁邱跃鹏也在会上表示:“云是大模型的最佳载体,大模型将开创下一代云服务的全新形态。”
为何腾讯姗姗来迟
据赛迪顾问数据显示,截至 2023 年 7 月,中国累计已经有130个大模型问世。
今年上半年,在百度、阿里等一众大厂争发大模型之时,“不赶风头”的鹅厂,显得较为谨慎。不过相较于各家大厂普遍踏足的通用大模型,腾讯从一开始就把大模型重心引向了B端应用。
6月19日,腾讯云首次公布了行业大模型进度,发布了TO B客户解决方案:腾讯云MaaS(Model-as-a-Service,模型即服务),覆盖了金融、文旅、政务、传媒、教育等10大行业的多个模型,并提供了超过50个解决方案。
那时,行业和客户已经有很多关于大模型的需求。在经历几个月的在腾讯文档、会议等应用磨练后,腾讯才终于有信心把大模型开放出来,服务更多企业。
▲图注:腾讯集团副总裁蒋杰
据腾讯副总裁蒋杰介绍,彼时,已经收到了很多客户需求询问,但还没有对模型进行全面深度的评测,处于半研发半应用的阶段。
“腾讯的混元的大模型的体系,一开始不光是为了业界做一个发布,甚至评测、去打榜,我们一开始就是根据腾讯企业自己的自身的应用,去做了一个这样的研发和匹配,去做一些跟大模型更深度结合的应用,才能够去抵消整个大模型高昂的设备、训练、人员的成本。”蒋杰说。
早在2022年4月,腾讯首次对外披露了旗下“混元”AI大模型的研发进展,完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型。但类chat大语言模型则是迟迟未推出。
事实上,过早地推出大模型,也容易“翻车”,出现“幻觉”。
所谓“幻觉”,简单说就是大模型“胡言乱语”。为了确保大模型更加可靠,降低“幻觉率”是大语言模型的重中之重,即便不能彻底解决,但也尽力从概率上降到最低。
据介绍,腾讯混元的“幻觉率”相比主流开源大模型可降低30%至50%, 用的是自研的“探真”技术来解决“幻觉”。
“外界其实一般多会用到知识图谱,甚至搜索外挂来让模型的检索支持能力变得更强,腾讯也会用,但不能用的比例很高。我们一定要在整个的大模型的预训练阶段把这个问题解决掉,控制掉。现在看到很多家开源模型和厂家发布的模型,搜索增强用到10%以上甚至更多,但这个会导致出现不一样的幻觉。”蒋杰说。
终局还是云之战
如今,大模型与To B的结合,已经越来越成为行业共识。在国内大模型之战打到焦灼之时,最近OpenAI 也推出了ChatGPT企业版,开始探索To B市场。
根据第三方网站 SimilarWeb 的监测数据,今年7 月,OpenAI 网站与移动客户端流量月环比下降了10.35%。8月中旬,市场调查分析机构 Gartner 也在发布的生成式 AI 炒作周期报告中指出,当前大模型发展已达到“膨胀预期峰值”,在未来的两到五年内,要么实现转型,要么跌入幻灭的低谷。
当下,前有ChatGPT企业板,后有开源的Llama2(Meta 的大语言模型),整个大模型行业门槛降低,市场则陷入了营收难的境地。
云厂商们也开始意识到 , 相较于难以预见的大模型商业化落地前景, 云作为最前端可以售卖的 To B产品, 更容易尽早赚钱。大模型的发展需要依靠算力、算法和数据的支持,这都需要云计算应用场景。也就是说,大模型之战的最终落地,还是要抢夺公有云市场。
而今年以来,随着个人、中小企业用户使用量减少,增速放缓,加之“政务云”的崛起,阿里云和腾讯云的市场份额均有所减少。
从资源利用率以及趋势来看,私有云难以成大势,公有云依然是主流市场。
根据中国信通院最新发布的《云计算白皮书(2023年)》,2022 年IaaS 市场收入稳定,规模在2442亿元,是PaaS+SaaS的3倍,依然占据主导地位。
IaaS靠规模效应赚钱,但投入过程长。但在激烈竞争下,产品同质化严重,云厂商不得已通过价格战来抢占市场。今年4月,新一波的降价潮开启,先是阿里云带头降价,京东云、腾讯云、华为云、天翼云等紧随其后。
IaaS 业务的高度雷同,低价策略难以可持续发展,腾讯云也开始探索不同的路线。PaaS、SaaS业务虽然体量小,但毛利率更高。但这两块业务投入大,腾讯云仍处于艰难的“爬坡”时期。
也因此,腾讯推出大模型,以提效为第一要义。“大语言模型更有商业永远价值的应该是提效,提效是更有价值的。”
蒋杰提到,腾讯是一个海量高并发的业务。“开源的很多的架构是不适应腾讯的体量,所以一定要走出一套基于自主体系的研发的道路,才能够去应对这些海量高并发的业务的冲击。”
大模型之战的同质化,让大厂间的竞争身位也难分轩轾。
蒋杰提到,如果未来对大语言模型进行评分,是一个综合实力的过程,“可能未来几个大的头部的厂家,评分差距只可能仅仅1分和2分的差距。这个版本他高了1分,下一个版本另外一个国内厂家就是再高了一两分,这是一个不断博弈和循序渐进的过程。所以其实随着大家投入这种资源不一样,抠的细节不一样,到最后这个差异才会出来。”
作者 | 赵子坤
编辑 | 李 原
运营 | 解一帆
关键词: