谈谈百度的「熵减」策略

这一轮国内 AI 大潮的演进,很难再用「技术突破」或「产品创新」来简单概括。如果换一个更贴切的描述,倒是更像在焦虑驱动下展开的系统性扩张。春节期间的红包混战、几家巨头大模型定位的频繁摇摆、到现在的全行业「龙虾」热,看起来是热闹的创新繁荣,如果把这些现象放在同一张坐标系里观察,会发现一个更深层的特征:在不确定性之中不断试探与外延,这其实上是一种典型的「熵增」过程。

这种熵增并不只体现在技术层面。模型参数持续刷新,能力指标不断被抬高,但用户的真实感知并没有同步提升;产品形态快速迭代,却缺乏稳定结构;内容生成能力显著增强,信息污染问题却愈发突出。随着前几天「315 曝光 GEO」事件的出现,用户对大模型内容的信任似乎开始出现裂痕。行业正在从「谁更强」的竞赛,悄然转向「谁更可靠」的比拼。

这样的背景下,百度的路径转变倒是显得有些反直觉。不再一味地强化参数竞争,在叙事上也不再不断切换,选择了一种更为克制的方向:全栈优势。其中全栈优势下,又主打应用驱动。这种聚集式创新,可以理解为一种「熵减」策略,即在系统复杂度不断上升的情况下,有意识地降低不确定性、压缩噪音、强化结构。

这种取向首先体现在模型层。此前围绕「铸币」读音的讨论中,多家大模型给出了不一致甚至错误的答案,最终反倒是百度内嵌的 AI 给出了正确结果。这个案例虽是个例,但却揭示了一个关键转折:用户真正关心的,并不都是模型能否给出更复杂的推理,还要看是否可靠、是否稳定、是否值得信任。在这一维度上,「更少幻觉」往往比显得「更加聪明」更有价值。百度没有把重心放在参数规模的极限拉升上,而开始更多投入在降低污染、减少幻觉,并通过产品结构提供交叉验证的可能性。这意味着正试图把大模型从一个「生成工具」,重新锚定为一个「可信工具」。

在产品层,这种熵减体现得更加明显。许多公司选择用 AI 去替代搜索,而百度则选择用 AI 去强化搜索。搜索的核心从来不只是答案本身,还需要信息的选择权与判断路径。将文心助手嵌入百度 App,让用户在 AI 生成结果与传统搜索结果之间形成对照,从而完成判断。这种设计看似减少了「自动化程度」,但却显著提高了系统的确定性。而类似「百看」这样的形态,搜索后以 AI 生成及检索综合呈现的多模态搜索结果,也是沿着同一逻辑展开:通过 AI 提升信息获取效率,同时保留用户对信息的解释与选择能力。在这里,AI 并没有取代人,反而是被约束在一个可验证、可对比的框架中运行。

对 OpenClaw 的布局,同样可以放在这一逻辑下理解。表面上看,这是对一个新趋势的快速跟进,但如果回溯百度在智能体方向上的长期投入,这更像是一次顺势接续。李彦宏较早提出「卷应用而非卷模型」,也在将竞争焦点从能力本身转向能力的结构化使用。围绕「龙虾」展开的一系列产品动作,我看到,龙虾创始人都点赞,并且喊话合作。无论是搜索 Skill 的快速增长,成为当下全球下载量第一的官方搜索 Skill,还是从云端到终端的多层部署,核心都指向同一个目标:把大模型能力转化为可调用、可组合的接口结构,而不是停留在孤立的模型能力上。这种从能力到结构的转化,就是一种典型的熵减过程。

更深一层的变化则发生在组织内部。百度新设立了基础模型研发部与应用模型研发部两大部门、文库与网盘成立新的面向 端的事业群,并且都向核心决策者直接汇报,这些动作并不只是管理层面的调整,还意在减少信息传递路径、压缩决策链路。在高不确定性的技术周期中,如果组织本身是高熵的,战略再清晰也难以落地。相反,只有在组织层完成熵减,技术与产品层的聚焦才有可能真正执行。

从更长的时间维度来看,这一轮 AI 可能最终会演化成出两类公司。一类持续制造新的可能性,通过更强的模型、更大的参数和更激进的产品形态不断扩展边界;另一类则致力于降低系统的不确定性,让这些能力变得可用、可信、可持续。前者推动熵增,后者完成熵减。

在行业的早期阶段,熵增是必要的,因为有必要探索边界;但在进入应用兑现阶段之后,熵减可能会成为决定胜负的关键。

因此,与其说百度在选择一条不同的路径,不如说它在选择一个不同的时间坐标。当大多数玩家仍然停留在扩张阶段时,提前进入了聚焦阶段。这种选择的难度,不在技术层面,在于需要放弃部分短期的叙事优势,接受一种更不显眼但更长期、更稳定的增长方式。

AI 的上半场,比的是谁能做出更强的能力;而下半场,决定结果的往往是另一件事:谁能在复杂系统中持续降低不确定性。从这个角度看,所谓「熵减」,并不是一种风格选择,而是一种不可回避的演进方向。产品的进步,也不在于增加了多少能力,而在于减少了多少不确定性。

百度的熵减底气,核心在于构建了全球罕见的「芯云模体」全栈布局。比如昆仑芯要独立 IPO了,投行也给出不错的估值。萝卜快跑,服务次数超过 2000 万次,已经落地全球 26 城。在底层算力与顶层物理 AI 两个关键领域,都跑出来了。

从用户规模来看,百度用户群体规模还是不可忽视,其多款产品的体量依然处在行业前列。现在的客观问题在于,技术能力与体验之间存在结构性落差。如果能够在既有流量之上,持续推进以「降低不确定性」为核心的用户体验优化,并坚持自身路径,其实是有机会逐步修复市场预期,从而缓解市值层面的焦虑。

文章原文

Continue Reading谈谈百度的「熵减」策略

阿里悟空,重写工作平台的底层

阿里发布了「悟空 WuKong」,面向企业的 AI 原生工作平台。看来 AI Agent 这件事,巨头要认真往企业场景里深耕了。

最近一段时间,行业里最关注的事情是「养龙虾」,OpenClaw,会自己调用工具的 Agent,无论是线上还是线下活动,都是热火朝天。而从企业的角度看,关心的是这套东西能不能进办公系统、进业务流程、进公司权限体系,最后进到日常工作里去。悟空被定义成一个面向全球公测的企业级 AI 原生工作平台,既有独立应用,也能在钉钉内使用。定位本身很明确:想做的是 AI To B 方向最重的那部分。 

这次最值得细看的细节是钉钉为了悟空把底层能力全面进行了 CLI 化,命令行界面演示的酷炫与否倒在其次,这个动作其实非常关键。很多 Agent 现在还是在图形界面上「看一眼、点一下、再等一会儿」,这种方式适合展示能力,很难高效支撑稳定业务下的重复操作。CLI 化意味着钉钉在把自己的表格、听记、聊天信息、文档、音视频和各类 SaaS 能力,整理成 AI 可以直接调用的程序接口,把软件的能力从「界面层」下沉到「调用层」

即时通讯工具正在从「信息传递通道」演变成「Agent 协作与执行的操作系统」。我不知道这个演变什么时候会完成,但当下,正在发生。

给传统软件加一个所谓「智能」的聊天框的方式已经过时了,现在需要用 AI 重写操作层。谁先做到这一步,谁才更有机会把 Agent 从「能玩」和「好玩」再带到「能交付」。 

还有一个我觉得很有意思的地方,是钉钉团队专门做了 Realdoc,一套 AI 原生文件系统。现在很多 Agent 改文件,还是整篇读、整篇写,像为了改一个错别字把整本书抄一遍,成本高,回退难,文件也容易越改越乱。悟空给自己搞了一套文件系统,支持按行号、按锚点、按正则去修改,还会自动保存快照、记录改动。听起来像工程细节,实际上这才是企业里最实用的东西:文件能不能精确改、改坏了能不能退、最后留下来的产物能不能管。很多 AI 产品输就输在这里,前面很聪明,后面一地文件。我不确定已经有了 Markdown 之后是否还需要一套文件系统,有待观察。

企业市场的门槛也在这里。权限、审计、安全、数据边界,这些词平时不一定能制造传播,但却决定了一个公司在评估后敢不敢把 AI 真放进去。悟空这次一股脑把统一账号、权限管理、技能分级、私有模型接入、全链路审计这些东西都放进了主叙事里,说明还是很清楚自己要解决什么问题。企业不缺一个会干活的 AI,企业缺一个知道边界、留下记录、出了事能追的 AI。这个要求和消费级产品完全不是一个维度。

再往上看,悟空还有一个大厂产品特有的优势:淘宝、天猫、支付宝、阿里云等阿里系能力会以 Skill 形式逐步接入,钉钉自己也在推企业级 Skill、Agent、Service 生态,另外还预置了面向电商、门店、法律、财税、开发等场景的 OPT「一人团队」套件。这个思路比较务实。AI 真正先跑起来的地方,未必是最复杂的大企业流程,反而可能是那些已经被压缩到极限的小团队、超级个体、一人公司。谁能先把这些高频、具体、可复用的工作做成开箱即用的 Skill,谁就更容易把 AI 变成生产力,而不是概念。

当然,发布会只是开始。悟空最后能不能跑出来,还是要看几件更硬的事:CLI 化带来的稳定性够不够,Skill 生态能不能长出来,企业用户会不会把它当成真正的入口,而不是又一个需要适应的新 App。

即便这些问题现在都还没答案,我还是觉得这次发布值得认真看一眼。原因不复杂:当很多公司还在忙着帮用户安装 OpenClaw 的环境时,钉钉团队已经在琢磨怎么让 AI 在企业里活下来。这个方向更慢,也更重,但大概率更接近 AI To B 的真实分水岭。

值得一提的是,钉钉这次还发布了全新「AI 应用」,AI App Builder,全码化 AI 应用搭建平台,升级开启人人都开发者的时代,以前是低代码,现在全码了,对于长尾业务需求,用这样的能力就可以构建出来。这对于曾以「一个不写代码的 CTO」而知名的我来说,还是想尝试一下的。

文章原文

Continue Reading阿里悟空,重写工作平台的底层