来源 / ToB行业头条 (ID:wwwqifu)
作者 / 樊航 · 编辑 / 海阳
时过半年,AI大模型热度仍然有增无减,造就了几乎全员参与的盛况。那些身处一线的从业者,他们在不同的论坛、会议、沙龙上从不同视角讲述着他们的理解。但深入去理解每个人的发言又会发现,他们似乎在某种程度上讲着趋同的论断。从早期的算力、参数、数据到如今的垂直大模型、数据飞轮、prompt、应用融合等一个个陌生的词汇进入视野,或许一线从业者已经在心中勾勒出关于AI2.0时代的发展蓝图。那么,当他们在讨论AI大模型时,他们究竟讨论了些什么?又形成了怎样的共识?作为学习者,在如今信息大爆炸的环境下,如何学会避免因为信息过载而丧失汲取“信息盛宴”的机会?作为从业者,如何透过他们的共识,找到AI发展浪潮中属于自己的船?
所有的产品都值得用AI重做一遍
“所有的产品都值得用AI重做一遍”,这句话最早出现在公众视野来自微软CEO Satya Nadella在微软新闻发布会时的讲话,紧随其后的英伟达黄仁勋、百度李彦宏、阿里张勇、360周鸿祎等等各个领域头部企业负责人也在公开场合有过同样的论断。“未来,面向智能化时代,所有公司在同一起跑线上。所有的软件、应用等都可以基于AIGC、大模型等新技术下都可以再重新做一遍。”阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在2023阿里云峰会上说道。从技术发展的角度上看,做出这样的论断无可厚非。AI大模型的出现是一个划时代的里程碑,它将人类带入到一个全新的智能化时代,重新定义了人机交互,成功地压缩了人类对于整个世界的认知,让大家看到了实现通用人工智能的路径,也因此造就了今天全员参与的热闹场面。从商业层面上讲,这一论断他们似乎也不得不讲。半年里通过大模型赋能或重构软件的案例每日都在发生,以AI大模型为中心的新的产业链条也正在形成,从最底层提供芯片和算力,模型层提供引擎底座到应用层提供智能服务,新的商业生态分层开始显著,于是可以看到,过去半年大家都忙得不亦乐乎,并将这一观点奉为圭臬。当然,同样一句话从不同人口中说出意思并不相同,要知道任何观点的背后都有其诉求和深意,同一链条上的上下游企业都拥有“分到蛋糕”的理由。以芯片为主的厂商正在不断对外售卖着镐和铲子,以模型为主提供基础服务的厂商逐渐走向商店模式,以应用层为主的SaaS厂商也在盘算着经济账,并大多都表示愿意为新的技术新的产品进行溢价投入,作为新商业生态下的每层玩家似乎都看到了商业前景。至于,谁最终会依靠新商业生态乘风而上,谁会沉没在该生态之下,谁都说不清。但企业应该时刻明白,我是否能驾驭它,还是成为它的奴隶。
数据和构建数据飞轮才是基本功
大模型之下,什么才是最重要的?给出最多的答案是数据以及构建一个有效运转的数据飞轮。过去几年,大约有一半的语言模型是通过扩大数据量来改进性能,没有数据“源料”,也就意味着大模型这台发动引擎就无法运转,自然也不会进步。一项来自 Epoch AI Research 团队提供的数据,全球高质量的语言数据存量将在 2026 年耗尽,那么未来的数据该从哪里来?在当下这个问题正在被尝试解决,一种方案是,运用计算机模拟生成的合成数据,通过计算机“举一反三”的模拟数据,为训练、测试、验证AI大模型和算法而生,相当于为AI大模型打造一片“题海”,不断去提升大模型能力。另一种方案是,理想状态下需要模型不断为用户提供服务,用户不断为模型生成新的数据,形成反馈闭环,最终通过数据飞轮不断优化模型能力,提供贴合客户需求的解决方案。通用大模型需要C端用户提供反馈,行业大模型则更需要去各个领域的具体场景中寻找答案。最后形成从使用者中来,再到使用者中去的良性循环,因为你实际采集的有效反馈越多,你就会比你的对手更清楚如何为客户提供有效服务。这一方式也决定了未来各大模型厂商的价值差异化,同时也是各垂直赛道企业间的胜负手。不可否认的是,实际操作过程自然不会简单,静态数据如何清洗,动态数据如何捕捉,怎样去打造属于自己的数据飞轮都是值得长期验证的事情。神州数码董事长兼首席执行官郭为在其年会上也同样表示,云生态和开源生态将使得数云融合真正进入一个新时代,AIGC大模型则加速了数据生成飞轮的驱动,成为引爆数字原生最重要的一个技术奇点。
Prompt prompt prompt
对大模型有一定了解的人对“prompt(提示) ”一定也不陌生,几乎所有的从业者都不可避免的提到这个词,尽管它目前没有准确的官方定义。猎豹移动董事长兼CEO傅盛在混沌大学的演讲中关于prompt的解释比较贴合实际。“自然语言天然的压缩性导致的天然歧义性,以及每个行业的专业属性,使得promot是嫁接大模型逻辑能力和应用需求的桥梁”。prompt重要的原因是因为,在使用大模型的过程中,超过80%以上的问题都是出于沟通不畅的原因导致的,而Prompt其实就是能跟AI沟通明白的话,这会促使沟通变得更加有效。也因此,对于应用层的企业而言,当前阶段应该是从数据里面充分挖掘出Prompt或者提示链,或者将专属的行业知识总结成prompt词,届时才能释放出大模型技术强大的能力,而避免因为沟通问题引发认知鸿沟。正如中关村科金技术副总裁张杰在接受澎湃科技记者采访时所言:“一定程度上,企业自身打造的prompt模板是密度更高的行业know-how”。
大模型 小工具
创业者劝告投资人,不要过分依赖于过往来自消费互联网的成功经验来审视AI大模型时代,过往互联网的经验可以通过用户角度去理解产品,但大模型时代需要去了解技术,它如何运行、如何评价一个团队训练和迭代模型的能力等等都是判断标准。创业者也在说服自己,拒绝用过去的移动互联网思维试图再打造下一个“抖音、拼多多、微信、淘宝”等超级应用,而应该脚踏实地,从细小颗粒度的小事慢慢做起。模型虽大,但背后的应用价值往往体现在细分场景之间。一个事实是,那些最早开始拥抱AI大模型并初次在各自业务场景进行探索的企业已经收获不小的成绩。在线3D云设计平台酷家乐联合创始人、董事长黄晓煌称基于AIGC实验室,酷家乐此前着力研究的“空间AIGC”场景应用带来超过40%的转化率,而此后又马不停蹄推出面向家居设计场景的“酷家乐AI”,将致力于为用户提供更加智能化的设计体验。国内领先的数字商业服务商微盟此前发布的大模型应用WAI,在618当周使用量迎来倍增趋势,以SaaS融合场景为例,微盟WAI单周内容生成增幅达到63%,其中公众号推文增幅400%,种草笔记标题增幅达257%,轮播图增幅达到了243%,场景生成内容的暴增从侧面反映了微盟WAI的实际应用中的不菲实力。基于大数据和AI技术的数字化转型服务商惟客数据也向「ToB行业头条」透露,通过大模型能力,其内部代码编写效率大幅提升,客服、知识问答场景实施成本降低90%,使用效果大幅提升。当然,做这些探索的不止于他们,实际上可以看到,越来越多的企业将AI应用带入到制造、客服、营销等多个生产环节,涉及的场景也从设计、OA、CRM走向各个软件领域。或许这种对应用场景的升级和探索接下来会成为SaaS扭亏为盈的一剂良方。
先动起来 实践大于一切
作为门槛极高的“烧钱游戏”,具有雄厚资金和产研团队的头部企业都争相赶着上“大模型”的牌桌。正如百度李彦宏所讲,先上牌桌,才有与国内甚至国际同行竞争的资格。作为创业派和SaaS从业者他们则更多专注于将大模型能力应用到其优势业务领域中,也如经纬创投创始管理合伙人张颖所说一般,先用起来、有效迭代大于一切。而作为产业里面不可或缺的一环,投资机构也在积极尝试寻找投资机会。常垒资本创始管理合伙人石矛也表示,真正的机会永远属于深入学习和不断思考复盘的人,而不是坐而论道,隔岸观火的人。他们作为整个产业链的参与者,尽管站在不同的角度,但都形成了“实践大于理论”的共识。按照各智库以及研究机构给出的发展趋势预测看,从当前的技术萌芽期走向膨胀期最少还需要3-5年的时间,而AI与应用的结合产品爆发期有望在今年下半年至明年持续走高。从整体市场表现来看,关于“AIGC”的话题热度或许会逐渐减少,但它会变为一个新的常态,贯穿在整个AI新时代发展之中。