零一万物李开复:绝不放弃预训练,ToB领域找到破局空间

2024年10月11日,有媒体发文表示中国AI六小虎(智谱、零一万物、MiniMax、百川智能、阶跃星辰)中最少有两家大模型公司要放弃预训练,尽管没有指名道姓,但也透露其中一家公司的重心已经放在了海外的AI应用产品。

该文一出,引起圈内广泛讨论,也将矛头指向了零一万物和百川智能,理由也很简单,其它四家最近相关动作频繁,但只有零一万物和百川智能在预训练大模型方面没有更新,且零一万物的ToC产品均在海外,文章指向性明显。

为此,零一万物CEO李开复博士在朋友圈发文辟谣,称零一万物一直在做预训练,去年和今年发布的Yi-34B,Yi-Large,Yi-Coder,Yi-VL,Yi-Vision都是发布时全球第一梯队,国内领先的预训练模型,而且即将推出的预训练模型也会是全球第一梯队,国内领先。

2024年10月16日,零一万物在新品线上发布会上正式对外发布了最新旗舰模型——Yi-Lightning以及首发面向ToB的应用产品AI2.0数字人,并解释了外界关注的重点信息:

1.零一万物绝不放弃预训练,尽管预训练模型是技术活,但只要有人才和决心,融资和芯片都不会是问题,国内同行也是如此。

2.OpenAI o1 的出现告诉我们,不止要关注预训练,强化学习、自我推理也非常重要。

3.Yi-Lightning 0.99元/每百万token,直逼行业最低价,但并不是亏着打价格战,当前仍然有利润可赚。

4.零一万物过去一直说过“不做赔钱的ToB”,并不是人们说的“不做ToB”,整个路径并不一样,当下零一万物已经找到了破局点,要做就做“盈利的ToB”。

5.尽管公司既做ToC和又做ToB面临挑战,但零一万物海外做ToC国内做ToB的策略,有自己的思考。

01.绝不放弃预训练

但未来会更加关注强化学习

自我推理等

预训练可以被视为大模型的基础教育阶段,它赋予模型海量而通用的知识。这一阶段是决定模型性能最关键的时期,也是模型厂商最核心的技术壁垒。

业界认为,大模型公司放弃预训练也就意味着主动走下AGI竞速的牌桌,也间接承认了此前做大模型服务商策略的失败。

李开复博士看来,做好预训练模型是一个技术活,公司要涵盖懂芯片、推理、基础架构、模型以及算法等方面的人才,才可能做出世界排名前十的预训练通用模型,尽管并不是每家公司都具备这样的条件,成本相对较高,也很有可能未来会越来越少的大模型公司做预训练,但零一万物绝不放弃做预训练,相信中国其它的大模型头部厂商也不会轻易放弃。

目前做一次预训练的成本大概在三四百万美金,这个成本头部模型公司都负担得起,从AI六小虎过去的情况来看,融资额和芯片都不会是问题,唯一考验的可能是足够好的人才和做好预训练的决心。

此次新品发布会也正验证了这一点,零一万物不仅没有放弃预训练,反而拿出了最新的旗舰型模型Yi-Lightning,“推理速度快、生成质量高、价格更便宜”成了Yi-Lightning最显著的标签,相比零一万物上半年推出的Yi-Large,Yi-Lightning首包速度提升一倍,推理速度提升4成,且每百万token只需要0.99元,定价策略也并非基于业内价格战,这一低价的情况下仍有利润空间。

据介绍,Yi-Lightning在LMSYS这一全球大模型必争的公开擂台上的表现让人眼前一亮,成为中国大模型企业中首度实现“超越OpenAI GPT-4o”的最佳成绩,也紧随OpenAI、Google之后,与xAI打平,进击全球前三大模型企业。

李开复博士也进一步解释道,过去很多人问,中国和美国的预训练差距是多远?十年,二十年?都不是,今天有很精确的数字可以回答这个问题,GPT4o在5月13日推出,零一万物在10月的今天将它打败,如果真的算中国赶超美国有多远的距离,至少零一万物只差五个月。

话虽如此,但也必须承认,OpenAI作为始终是第一个吃螃蟹的人,所面临的挑战并不是后来者可以想象的,尤其是最新的OpenAI o1的发布之后,为业界再次带来了新的震撼,包括零一万物在内。

OpenAIo1 的思考模式是把之前只在预训练中 scaling 的趋势扩展到了推理的时候,类似于人类在回答难题之前的长时间思考,OpenAIo1 在尝试解决问题时会通过思考将问题拆分,并步步为营,反复思考每个小任务,认识并纠正错误,当一个方法不起作用时,它会尝试另一种方法,从而极大提高模型的推理能力,原来追求的快思考变成故意放慢速度以追求更加准确的结果。

李开复博士也坦言,一年半以前大家觉得大模型最厉害的地方就是预训练,一年以后大家慢慢发现后训练SFT和强化训练都非常重要,这感谢OpenAI点醒我们这一点,相信现在很多中美公司都在往o1 方向狂奔。

02.国内重ToB 海外重ToC

零一万物的策略是什么?这或许是过去大家都关心的问题。

ToB领域是天然的AI试验场也是掘金地,这在大模型浪潮之初就成为业内共识,但在李开复博士眼里,传统企业对新技术的采纳程度、以及对软件的付费意愿、自身需求的了解程度、业内做一单赔一单的低价竞争等等因素,都让国内大模型ToB应用面临困境。

李开复表示,零一万物国内着重ToB业务,但不做赔钱的ToB业务。在大模型时代,能赚钱的ToB业务需要有不一样的打法。

国内着重ToB,海外着重ToC,便是当前零一万物给出的答案。

国内着重ToB,是因为零一万物找到了一些破局的空间。

此次发布的ToB企业的解决方案里,包括 AI 2.0 数字人解决方案、全行业解决方案、AI Infra 等产品及服务,面向 B/G 端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

比如首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入Yi-Lightning全新加持的数字人直播后,GMV较此前上升170%。

“最好的是能够有一个大模型公司看到完整的用户需求,专注到用户的痛点需求和赢利点,从端到端打造一个完整的解决方案,让购买大模型和数字人的公司能立刻使用就赚钱,用得越多赚得越多,这样他对我们的付费意愿也会增长,而不是像过去一样先进去再找场景,路径不一样,结果也大不一样。”李开复表示。

而且零一万物ToB解决方案不追求数量而追求质量,涉及领域也会比较从最易商业化的垂直细分领域入手,尽量做到每一个解决方案对应的领域场景有足够大的商业化空间。

至于 ToC业务主要布局海外就更好理解,最早零一万物产品迭代就在海外,有些已经在国外应用运营良好,且零一万物海外ToC的变现能力和消耗用户增长的成本算账可以算得过来。

而在国内,流量成本是一个很大的问题,当前很多友商的流量获客成本已经从十几人民币加到三十多,且最近还呈现用户流失的现象,整体的挑战环境让零一万物在选择市场方面更加谨慎。

谈到同时做ToB又做ToC策略,李开复博士也坦言,一个大模型公司同时做ToB和ToC很辛苦,需要多元化的管理方式,因为两个团队的基因不一样,做事的方法和衡量KPI的方法都不太一样,尽管零一万物在这两个领域有经验,也在试着做,但是也绝对不能什么都做。重要的是,不论是ToB,还是ToC,考验的还是底层模型技术能力,这是核心基础。

ToB
分享到

点赞(0)

说点什么

全部评论