IT-Tech Archives - Page 65 of 112

百万上下文之后，拼什么？

Post published:2026-05-06

（本文作者为科技不许冷，钛媒体经授权发布）

文 | 科技不许冷

过去几天，科技圈的视线全被DeepSeek吸走了。

满屏都是传闻中的估值溢价，或者是跟各类国产算力芯片的适配通稿。市场的狂热情绪，很容易让人迷失在庞大的数字迷宫里。大众的关注点，要么是“百万上下文“这个听起来很唬人的标签，要么是跑分榜单上“谁又赢了谁零点几分”的算术题。

DeepSeek V4-Pro的分数确实好看。从其技术报告披露的底牌来看，在SimpleQA-Verified测试中，它以20个绝对百分点的优势甩开了所有开源对手；在Codeforces代码竞赛里，预期评分直接追平了GPT-5.4。当然，在世界知识的广度上，它依然略逊于Gemini-3.1-Pro；遇到极高难度的复杂任务，跟Claude Opus 4.6也还有微小的身位差。

但这都不重要。

如果你只盯着榜单排名，就完全看漏了这家机构真正的野心。

DeepSeek根本不是在发布一个用来刷榜的模型参数包。它实际上是在一点点拆开“百万上下文”这件事的底座。

大模型的战争，已经从模型层退场，全面接管系统层。

过去几年，行业都在拼脑容量。比谁的参数多，比谁跑分高。但这套玩法到头了。V4的出现，是在定义一套新规矩：模型本身，只是高效工程系统自然结出的一个副产品。

当1M上下文变成所有官方服务的出厂默认值时，从其开源实现中可以清晰地看到一个事实：这绝对不是靠算力硬堆出来的。长文本时代的下半场，拼的从来不是智商。

而是机房调度能力。

13B激活参数，把37B按在地上

调度能力从哪看出来？先看V4最反直觉的一个设计：Pro和Flash的共生关系。

行业里一看到“Pro”和“Flash”，第一反应就是精准刀法：Pro用来打标杆，Flash用来做下沉市场，收割中小企业。

这种典型的商业包装逻辑，放在V4身上，看偏了。这两者根本不是算力降级关系，而是验证同一套底层逻辑的对照组。

大模型过去的长文本能力，本质上是用显存硬堆出来的伪能力。只要给的GPU够多，显存够大，不管多长的文本都能硬吞下去。但代价是，成本高到根本没法在真实的商业环境里铺开。

V4-Pro以1.6T的总参数和49B的激活参数把容量拉到了顶。但真正的大招，是那个只有284B总参数、13B激活参数的V4-Flash。

文档里的一个数据直接戳破了行业的窗户纸：在大量极具挑战性的测试中，只有13B激活参数的Flash-Base，直接超越了上一代37B激活参数的V3.2-Base。

13B的极小激活代价，绝不是能力缩水，而是一次底层的效率重构。Flash的意义，不是为了证明它能有多省钱，而是为了证明“算力霸权是可以被架构重构打破的”。

参数规模，已经彻底失去决定性意义。

调度能力，正在取代参数，成为新的主战场。这让百万上下文不再是高阶英伟达集群的专属玩具，国产芯片也能顺畅地接管战局。未来开源模型的分水岭，不再是看谁的底座大，而是看谁能用十分之一的力气干同样的活。

专家和稀泥，不如各管一段

硬件效率是一面，另一面是软件效率。V4在’后训练’阶段也换了一条路。

大模型的“后训练”阶段，过去一直走在一条死胡同里。

行业惯用的混合强化学习（Mixed RL），说的直白点，就是和稀泥。如果你想让模型既懂微积分，又会写C++，还能做日常规划时，传统的做法是把所有的参数强行往中间捏。结果就是“向均值回归”。

强行捏在一起，特化能力全磨平了，最终只会均值化成平庸的通才。

V4换了一条路。不是改良，是彻底换道。技术报告里交代了新解法：先独立培养专家。数学专家就只管算数，代码专家就只管编程。把单一维度的能力拉到满。

关键在于最后怎么合并。V4不用业内泛滥的参数平均法，而是用了同策略蒸馏（OPD）。

传统的权重合并是一种静态妥协，而OPD是一场动态接管。

统一模型在自己生成轨迹时，遇到数学题，系统就精准引入数学专家的梯度来指路；遇到写代码，就无缝切给代码专家。大家各司其职，不在参数层面打架。

顺着这条线往下看，V4应用端那个很火的“三种推理模式”（无思考、高强度思考、极限思考），根本不是加了个UI按钮那么简单。它是OPD机制在产品端的直接变现。

在极限思考模式下，底层提示词会强制模型去分解问题、穷尽边缘情况。这种极其固执的死磕行为，恰恰是在OPD阶段，在“数学专家”和“编程专家”的高强度捶打下固化下来的本能。

OPD不搞平均。遇到数学题，接数学专家；遇到代码，接代码专家。各管一段，不在参数层面打架。

Agent跑了三小时，不能失忆

换完训练方法，换应用场景，长上下文到底能干嘛？

如果只是为了在十万字的研报里找一句话，那不叫长上下文，那叫高级检索。真实的商业场景里，Agent要替你重构代码、跨系统验证数据、甚至跑一整晚的流程。

在这个过程里，最致命的问题是“失忆”。

V3.2有个让工程师极其头疼的痛点：新消息一进来，模型之前的思考痕迹直接清空。普通聊天这么干没问题，省资源。但如果是跑了三个小时的Agent任务，半路插进去一句话，模型脑子一白，整个状态全部丢失，得从头算。

这种链条断裂，在实际业务中直接接不住。

V4给出的方案是“交织思考”。逻辑很冷酷，分场景算账。

只要是带工具调用的长程场景，跨越消息边界，推理链条完整保留。如果是闲聊，继续清空，绝不多浪费一丁点算力。模型开始真正懂得“在什么场合，该记住什么”。

更绝的是它的快速指令（Quick Instruction）。

以前行业里做意图识别，都习惯在外面挂个小模型。这意味着每次有新请求进来，不管长短，系统都得把用户的提示词重新嚼一遍。这本质上是在白白浪费预填充计算。

V4没这么干。从其开源代码中可见：直接在输入序列末尾插几个隐式指令。主模型之前算好的海量特征（KV Cache），直接复用。

长上下文的核心问题，从来不是“记得多”，而是“算得起”。

这其实就是粗暴地砍掉了一次冗余的预填充计算。行业默认一个功能配一个小模型，V4用行动证明：不用。KV Cache复用吃透了，长程Agent才能跑起来。

完全缓存、定期存、不存，都疼

能跑不代表能卖。

第17页有个细节，自动生成的kernel，跟手写CUDA逐位比对。不是差不多，是每一位都一样。这种工程洁癖，业务里少见。有这底线，才敢算部署账。

高并发的百万上下文，拼的根本不是大模型懂不懂人类，拼的是你懂不懂硬件的物理极限在哪。

文档里三种调度策略都列出来了，没有藏着掖着，全是取舍。

想追求计算零冗余？上“完全缓存”。但代价是，固态硬盘的I/O通道可能在几秒钟内被高频写入直接挤爆。

想保护硬盘？上“定期检查点”。隔一段距离存一次。硬盘保住了，但GPU得时不时腾出算力来给丢失的尾部数据擦屁股。

要是干脆不上物理硬盘缓存呢？那就选“零缓存”。省下全部存储带宽，全靠长程特征做锚点，碰到问题GPU现场硬算。

这三条路，哪条都不是完美的。这本质上就是一场关于硬件寿命、并发峰值和用户延迟容忍度之间的极限算账。它把冷冰冰的现实摆在所有人面前：AI早已不是单纯的算力密集型产业，它正在加速变成调度密集型产业。

写在最后

看DeepSeek V4，如果还停留在跑分榜上，那就连门槛都没摸到。

OPD的能力动态接管，交织思考的记忆保留，砍掉预填充的快速指令，还有那些把硬盘和显存算计到骨头里的落盘策略。

这些枯燥的细节，其实是一根线上的蚂蚱。

大模型在变。

不再是陪聊的玩具。

而是开始接管真实世界的业务链条。

DeepSeek不是在赌未来，它是在建机房。外界还在聊分数，分数只是机房运转时的副产品。

当对手还在为跑分榜上的零点几分沾沾自喜、向市场炫耀那几百亿参数时，DeepSeek已经在算每百万Token的电费。

战局已经很清晰了：

下一场长文本战争，决胜点不是智商，是机房成本。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

剂泰科技IPO：115亿港元押在首付款之后的持续性上

Post published:2026-05-06

（本文作者为舒书，钛媒体经授权发布）

文 | 舒书

剂泰科技5月5日正式启动公开招股。发行价10.50港元，全球发售2.01亿股H股，募资约21亿港元。发行后总股本约11亿股（根据公开信息推算，以招股书最终披露为准），发行市值约115亿港元。

18家基石机构认购1.48亿美元（约11.59亿港元），占发行规模约54.9%。基石比例超过50%，在港股生物科技IPO中偏高。2024年港股18A生物科技公司IPO的平均基石占比约40-60%，54.9%落在此区间上限附近。但高基石占比不一定完全代表机构抢筹，也可能是公开发售认购偏弱下的定价平衡。超额认购倍数才是真正的测温计——若公开发售部分超额认购倍数低于5-10倍，54.9%的基石占比更像是包场式托底，而非市场热捧。

贝莱德领投5000万美元，UBS、韩国未来资产、日本欧力士跟进，国新基金首次出手AI制药，高瓴、IDG、华登国际同步入局。

一、基石图谱：五类资本，五套定价逻辑

基石投资者五类同框并不意味着五类资本都看好了同一个故事。每类资本对剂泰的定价逻辑完全不同：

资本类型	代表机构	投资逻辑
国际资管	贝莱德、UBS、韩国未来资产、日本欧力士	押注AI纳米递送平台的全球竞争力，要求年化15-20%回报
国家级基金	国新基金（首次出手AI制药）	战略信号意义，不等于国家托底
专业医疗基金	Deerfield、RTW、清池资本	验证技术临床价值，尽调周期12-24个月
AI科技基金	华登国际、高瓴、IDG	看重NanoForge平台的跨行业延展性，持有周期5-7年
中资公募	广发、工银瑞信、华夏、富国	二级市场接受度信号，但有从众跟投特征

国际资管（贝莱德、UBS、韩国未来资产、日本欧力士） 的投资逻辑是押注剂泰能否成为亚洲的Moderna——AI递送平台一旦跑通，其跨赛道复用的基础设施属性，估值弹性极大。但它们通常要求年化回报率在15-20%，且对商业化兑现时间表非常敏感。如果剂泰在上市后12-18个月内未能落地第二笔大额BD或平台订阅收入，国际资管的持仓意愿可能迅速逆转。

国新基金作为央企战新基金旗下独立运作的市场化基金，其投资决策有明确的战略导向性。央企战新基金首期510亿元，明确投向生物医药等战略性新兴产业。国新首次涉足AI制药领域，标志着国家级资本已将AI药物递送纳入视野。但这只是“信号”，不是“托底”。国新基金的尽调周期通常为6-12个月，投资金额在基石中的具体占比将直接影响“信号”的强度——若国新仅贡献5-10%的基石额度，其信号意义不应被过度放大。

Deerfield等医疗专项基金的尽调以严苛著称，通常审查12-24个月的临床前数据、靶点选择逻辑、监管路径可行性。它们出现在基石名单中，是对MTS-004临床进度的背书，尤其是对其III期试验数据的完整性和符合pre-NDA申报要求的认可。

高瓴、IDG等AI科技基金看重的是平台复用性。NanoForge覆盖8个关键器官和组织的精准靶向递送，这项技术不止于制药——动物健康、抗衰老、医美等领域都有延展空间。这类基金的持有周期通常为5-7年，对商业化的容忍度高于国际资管，但也要求剂泰在平台跨行业落地上给出明确路线图。

中资公募罕见同框，往往是从众跟投的防御性配置占主导。公募基金在IPO阶段锁仓，通常约定6-12个月的锁定期，它们更关注剂泰上市首日表现和短期股价波动，对长期估值的判断权重较低。2024年港股生物科技IPO中，公募基石占比超过15%的公司，上市后6个月内股价破发率约为60%（统计样本为当年18家公司，破发指收盘价低于发行价）。这组统计样本量有限，不宜过度解读，但反映了高公募占比与短期破发之间的历史相关性。

基石图谱

二、财务基本面

财务

营收结构：一次性收入占95%

1.05亿元营收中，约1亿元来自MTS-004对外授权的首付款，是一次性资产出售而非持续性收入。五大客户收入占比98.9%，第一大客户占比95.2%。扣除首付款后，经常性收入仅数百万元级别（主要来自CRO服务及其他平台合作）。2023年930万元→2024年150万元→2025年1.05亿元的过山车式曲线意味着：如果2026年没有新的里程碑事件触发，营收可能再次回落至千万级以下。

毛利率跃升：一次性事件

98.2%的毛利率是收入结构切换的结果——知识产权交易没有生产成本。一旦首付款确认完毕，毛利率会回归常态（2023-2024年水平约为55-60%）。剂泰是否会重返CRO服务模式，取决于2026年平台合作的推进节奏。

现金储备：最硬的底牌，但有时间约束

11.3亿元现金是剂泰最硬的底牌。对现金runway的计算必须同时考虑账面亏损和现金流两个口径：

按经调整亏损1.8亿元计算，静态runway约6年
按经营现金流流出约3.3亿元计算（经调整亏损1.8亿+非现金费用约1亿+营运资金占用约0.5亿），静态runway约3.5年
若管线推进至临床后期，研发开支加速增长（临床II/III期成本通常为临床前的3-5倍），runway可能缩至2-2.5年

若MTS-004进入商业化准备阶段（销售团队搭建、市场准入），或新管线进入临床后期，烧钱速度可能从3.3亿/年翻倍至6-7亿/年，届时runway将缩短至1.5-2年。11.3亿元并不宽裕。

现金跑道测算

三、技术壁垒

NanoForge平台宣称拥有超1,000万种结构多元化的脂质库，已完成超过10万个湿实验数据点的验证。公司已备案217项专利申请，获授52项（来源：招股书及公开专利数据库）。

虚拟库vs真实库

1,000万种脂质，绝大部分是虚拟筛选库，属于已构建但未合成的理论潜力。已合成并经过实验验证的脂质，真实规模远低于1,000万。100:1的比例意味着验证全部虚拟结构还需要100倍的投入与时间。

按每个湿实验数据点成本约1万元估算（行业估算，含试剂、设备、人力。实际成本因实验类型差异巨大：体外细胞实验约0.5-2万元/点，体内动物实验约5-20万元/点，毒理实验50万元以上/点。剂泰10万数据点的具体构成未披露，此估算存在较大不确定性），从10万到100万需要约90亿元投入。剂泰账上现金11.3亿元，即使全部投入也仅能增加约11万个数据点。距离非线性加速所需的百万级数据规模，资金缺口是数量级的。

获授率约24%，在生物科技初创公司中处于中等水平（行业平均约20-30%）。但24%本身无法判断好坏——若因专利申请策略激进（大量申请，宽进严出），则是中性信号；若因技术新颖性不足或专利撰写质量差导致频繁驳回，则需要警惕。核心问题是：52项获授专利中，有多少覆盖NanoForge平台的核心算法或关键脂质结构？专利覆盖地域是否包含中美欧日韩等主要市场？这些信息招股书未详细披露。

数据飞轮的非线性拐点

真正的非线性拐点不是百万级数据规模，而是AI模型预测精度达到可大幅减少湿实验验证的水平。这需要的不是数据量的线性增长，而是数据-算法-湿实验三者之间形成更高效的反馈闭环。但招股书未披露AI模型的历史预测命中率及提升曲线，无法建立“数据集规模→预测精度”的定量关系。2026年4月，NMPA发布《关于“人工智能+药品监管”的实施意见》，明确构建AI辅助审评审批体系，但对AI预测能否替代部分湿实验数据尚无明确指引——这是数据飞轮叙事的监管不确定性。

技术壁垒

四、三小龙同台：95倍市销率的溢价从何而来

剂泰上市后，AI制药三小龙齐聚港交所。按2026年5月初汇率统一换算：

三小龙

剂泰的市销率约95倍，远高于晶泰（29倍）和英矽（41倍），是市场为递送基础设施故事支付的高估值溢价。按经常性收入约数百万元计算，调整后市销率将高达2300倍以上。

递送是几乎所有生物药的卡脖子环节——这是剂泰享有估值溢价的结构性理由。但卡脖子能否转化为高定价权，取决于三个条件：

技术的不可替代性：NanoForge的靶向器官数量（8个）和递送效率是否显著优于LNP等现有技术
专利布局的强度：核心专利的剩余有效期、覆盖地域、被挑战风险
模仿难度：竞争对手能否通过挖角核心团队快速复制

这些条件中只要有一个不成立，溢价逻辑就会动摇。

五、跟踪清单

上市后12-24个月内，四个信号将决定剂泰的估值逻辑是否成立。剂泰的现金储备约可支撑24-30个月，信号一和信号二的验证窗口与现金runway匹配度较高，是剂泰最需要优先兑现的两个承诺：

信号	核心指标	预期时间	与现金runway匹配度
持续性收入	经常性收入占比是否提升至20%以上	6-12个月	✅ 匹配
续约模式	存量客户是否有续约或扩购案例	12-18个月	✅ 匹配
数据飞轮	湿实验数据点能否从10万增长至13-15万	12-24个月	⚠️ 部分匹配
管线多元化	是否有一条新管线进入临床II/III期	18-36个月	⚠️ 时间偏紧

关键跟踪信号

六、结语

115亿市值对应95倍市销率，市场的赌注是剂泰能在未来12-24个月内将一次性收入结构转化为持续性平台收入。这个赌注是否成立，四个信号将在不同时间窗口给出答案。

首付款是起点，不是终点。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

Palantir：软件末日论汹涌，最牛信仰股也松动了？

Post published:2026-05-06

（本文作者为海豚研究，钛媒体经授权发布）

文 | 海豚研究

Palantir Tech(PLTR.US) Q1 业绩整体仍然不俗，尽管连续的硬核业绩消化了一部分的估值溢价，但其中关于 “美国商业收入不及预期”和 “订单波动和指引增速趋势放缓”的两个瑕疵，叠加 AI 叙事的影响，还是削弱了资金短期做多意愿，财报反馈平淡。

具体来看：

1. 指引上调，但趋势要放缓？：Q1 收入继续加速增长 85%，公司对 Q2 的指引增长 79% 左右，全年收入预期上调到超 76 亿，同比增长 71%，均超卖方一致预期。但从后续增速有放缓趋势（Q2&H2），可能引发了买方资金的不满。

不过按照 Palantir 一贯 Beat 指引的习惯，二季度应该仍然有望实现加速增长。而 4 月以来的订单签约情况来看，全年高增长趋势应该也不会有太大问题。

2.“无惊喜” 的美国市场：Q1 美国客户收入整体翻倍增长，增速看依旧保持高景气度，公司对美国市场的依赖程度也提高到收入占比 78%。不过，虽然美国政府、美国商业收入的增速均很亮眼，但市场原先的预期要比实际更乐观。

（1）美国政府：国防部 “灯塔效应” 发挥影响，多部门采购

美国政府收入被视作 Palantir 的护城河，虽然是业绩托底的存在，但 Q1 超 84% 的增速依旧亮眼。

目前 Palantir 不只是存在于国防部的合同续期或新增项目中，还渗透到了能源部、财政部以及农业部的采购意向上。尤其是农业部，一季度和 Palantir 签下了 3 亿美金额度上限的合作框架。

（2）美国商业：狂飙 133%，但仍然 miss 预期

资金最关注的美国商业收入，可以说是估值向上的核心支撑点，虽然本季度依旧是高增长 133%，环比 Q1 的 137% 略有放缓，但不及更乐观的市场预期。市场预设的还是环比加速的起量趋势，财报前部分机构预期甚至达到了增长 140% 以上。

不过，管理层对全年美国商业收入给了增长 120%+ 的指引，这意味着下半年在显著更高的基数下，Palantir 在美国企业客户上的需求仍不低。

3. 国际需求意料之外的回暖：国际商业收入比较意外的出现了加速回暖，增长 26%。

Palantir 因为一直强调对美国优先、服务美国安全的长期经营战略，因此除了英国政府，国际政企出于安全目的，对采购 Palantir 产品服务都会有所犹豫。当下增长反弹，可能是因为吸引到更多全球企业的合作，以及上季度就已经推进的头部咨询机构合作，从而提高了产品和品牌跨市场的影响力。

不过在加速回暖的持续性上，海豚君认为还是谨慎乐观。CEO 的每一次 “本土保护主义” 发言，都可能会影响国际市场的进一步开拓。

4. 前瞻指标：政府需求稳定高景气、企业需求或存在新增放缓

（1）中长期视角关注 TCV、RPO、客户数量：一季度 TCV（总合同价值）同比增长 61% 达到 24 亿美金，增速环比有明显放缓。挑大梁的美国商业订单季度增速在上季度显著放缓下，继续滑落至 46%，表明当下新签合同主要在政府端。

一季度 RPO 依旧保持 134% 的高增速，TCV 和 RPO 增长趋势出现连续季度的偏离，也能同样说明合同额的短期增量主要是政府端：

RPO 表明剩余合同中已经明确锁单（无法取消）的金额，政府合同往往金额高、且不可取消的比例也相对较高（目前政府订单多来自美国和关系较好的英国，取消或违约可能性不高），因此往往会导致订单指标出现短期脉冲。比如去年 Q4，以及今年 Q1 美国政府就出现了多个部门（农业部、国防部、能源部、财政部等）对 Palantir 产品和服务的采购/续约，合同签署扎堆。

当然，新增订单情况存在一些季节性波动，但还是需要继续关注企业端订单情况，毕竟商业市场才是更容易支撑估值向上的关键。

Q1 客户数量整体净增 53 家，其中政府新增 1 个（合作部门），企业新增 52 家，44 家美国企业，8 家国际企业。

（2）短期上市场主要关注 Billings、NDR 变化：一季度 Billings 同比增长 93%，整体合同负债（含客户定金）环比净增加近 1.2 亿，环比增加。来自老客户的收入净扩张率 150%，环比继续提高，体现品牌心智提升和深入合作的趋势。

5. 业绩指标一览&订单新增情况

海豚君观点

Palantir 在当下的基本面整体上没有大问题，这代表后续的增长仍有希望保持高速，但由于高估值的原因，使得资金非常在意增速放缓，哪怕可能最后只是季节性波动。因此当 Q1 财报中，美国商业收入 miss、指引隐含增速放缓、总订单额 TCV 增速持续收敛下，至少赌财报的资金会离开。

但又因为此前软件股杀估值中，Palantir 也跟着消化了一些，因此一份整体看也不算差的财报，资金想要进一步大惩罚的意愿也有限，因此也就削弱了空头回补动力。

短期来看，虽然国际市场回暖，但海豚君认为，无论是短期业绩还是估值逻辑，都还是比较依赖美国市场（政府订单做托底，企业合同拉高想象力），但可以看到有一些客户的态度已经逐渐从参加 bootcamp 的试一试心理，转变为大规模放心合作：一季度的新合作中，除了政府订单，企业中的中长期合作也在明显增多。

而对于此前 Anthropic 等大模型的威胁，海豚君认为可能也无需太悲观去看：

Anthropic 发的两个产品，一个 Mythos 是定向部署的网络安全工具；另一个 Managed Agents 则是托管 AI Agents 运行时的基础设施，方便企业将现有大模型赋能到商业流程中。我们认为，不仅是应用场景的重合度偏差，这两个 Agents 与 Palantir 的 AIP 服务以及 Foundry 中的 Ontology 还是有真正实用性的差距。

这里面的关键在于 Palantir 是基于企业内部需求做的定制化部署，这里面不仅涉及到 Ontology 的设计（不同实体/元素、实体与实体之间的映射关系等），实现牵一发而动全身的效果（对企业面对的不同变化做出正确的跨部门决策），同时还涉及到企业内部不同数据复杂的授权范围，这是基于概率输出结果的通用 LLM 运作原理有根本差异的地方。

当然 LLM 也可以基于特定企业去做调试和定制，但这个需要铺专门的人力去配合企业完成，以及还需要一些 “小白鼠” 企业去做先行试验来做同样的效果背书。反过来说，在这一点上，Palantir 还有一些明显的先发优势和口碑认证的。

最后看看高估值通过不到一个季度的股价调整和业绩超预期增长，消化了多少：盘后 3412 亿市值，对应 26/27 年经调整经营利润分别为 76x/47x Adj.P/EBIT（已对业绩预期针对新的指引和增长趋势，做了显著上调，预计 26、27 年收入增速分别为 75%、60%，经调整经营利润率为 58%），相比年初接近百倍 PE 的估值消化了一部分，但仍然算是一个不低的估值水平，对高增长持续性的要求还是不低，这可能需要公司持续交出亮眼的业绩来支撑当前估值。

以下为详细分析

一、对美依赖度提升，但超预期在国际市场

一季度实现总营收 16.3 亿美元，同比增长 85%，超市场预期（～15.4 亿），增速继续环比上季度拉升。

Palantir 主要是向客户提供定制化的软件服务，因此收入在短期内可预期性较强，公司的指引区间也比较窄，隐含收入的确定性较高。不过海豚君两年跟踪下来，发现 Palantir 的 CEO 虽然在股东信中比较狂妄自信，但指引总会被业绩超过。

1. 分业务情况

（1）政府客户收入：订单扎堆，跨部门渗透

一季度政府客户收入同比增长 76%，增长主力依然是美国本土，继续环比加速增长。近两个季度多个美国政府部门与 Palantir 签署合同，比如农业部在 4 月直接确认了 3 亿额度的合同框架。

国际政府同样小幅加速，但应该主要是确认消耗之前的英国、德法政府合同，当下新增订单不多。

（2）商业市场：美企需求爆棚，国际企业需求回暖

一季度商业收入同比增速 95%，继续加速。其中：

美国本土企业收入继续狂飙 133%，但市场预期更高。老客户的使用粘性稳定提高，净美元留存率达到 150%（隐含过去 12 个月的老用户支付增长 50%）。

国际企业增长意外回暖，客户数也环比增加了 9 家，这里的反弹除了 Palantir 本身可能与全球头部咨询公司合作有一定关联。不过对于后续的持续性，海豚君仍然存在一些顾虑，打算再跟踪一段时间的国际企业合同情况。

二、前瞻指标情况：政府需求稳定高景气、企业需求或存在新增放缓

对于软件公司而言，未来的成长性是估值的核心。但每季度确认的收入，这个指标相对滞后，因此我们建议重点关注新合同的获取情况，主要表现为合同情况（RPO、TCV）、当期账单流水（Billings）以及客户数量的增加。

总体来看，Q1 前瞻性指标继续体现了政府需求的稳定，和企业需求的波动，

（1）剩余不可撤销的未履约合同（RPO）：中长期合同大幅增加

一季度 Palantir 剩余合同额跃至 44.5 亿美元，环比净增加了近 3.7 亿。上季度包含了政府大单的脉冲影响，所以这个季度的净增是自然放缓，但增长仍旧不俗。

（2）当期账单流水（Billings）& 递延收入：健康，但也有放缓

一季度账单流水近 17.5 亿美元，同比 93% 的增长，也是受大订单的签订和打款。整体合同负债（含客户定金）环比净增加，老客户的付费规模扩张率 150%，环比继续提高，体现老客户粘性加强，升级付费的趋势。

（3）合同总价值（TCV）：与 RPO 偏差印证政府订单扎堆、企业存在季节波动

一季度记录的合同总价值为 24 亿，同比增长 61%，环比减少 18 亿，增长再次放缓。TCV 与 RPO 的偏差，恰恰说明新增的合同中，签署即锁单（RPO）的政府合同占比较多。

（4）客户增量：美国企业贡献主要增量

而从最直观的客户数，也偏中长期指标，一季度环比净增 53 家，其中 52 家来自于商业客户（其中的 44 家是本地美企），1 家来自政府。

三、盈利能力继续创新高

一季度 Palantir 实现 GAAP 下经营利润 7.5 亿，三项经营费用中本季度销售费用、管理费用的增长有反弹，但仍然显著低于收入。最终带来 GAAP 下经营利润率环比提高了 6 个点，达到 46%，加回折旧和 SBC 后的经调整经营利润达到 60%，相比上季度也提高了 3pct。

Palantir 的现金流与合同打款有关，因此会出现季节间的波动。Q1 仍是订单爆棚的继续新增了不少合同订单，导致自由现金流通高增长 150%。管理层全年指引现金流 42-44 亿，截至一季度末账上已积存现金 + 短期投资达到 80 亿美金。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

豆包开启付费订阅，国内AI商业化迎来拐点？

Post published:2026-05-06

（本文作者为 AI价值官，钛媒体经授权发布）

文 | AI价值官，撰文丨星野，编辑丨美圻

5月4日，豆包在App Store更新开发说明，新增订阅服务声明，“豆包付费”迅速登上各大平台热搜，引发全网热议。但对于关注豆包发展的业内人士来说，这个消息激起的与其说是惊讶，不如说是一种靴子落地的感觉。

此前，字节跳动的商业化压力已经通过多个维度传递出来：净利润承压、豆包Token日均使用量突破120万亿且算力消耗持续攀升，同时悄悄试水电商变现。这些信号拼在一起已经足够清晰——豆包在认真考虑投入产出比了。

告别纯免费时代，也是国内外AI产品眼下的普遍共识，豆包不过是在合适的时机迈出了这一步。

此次公布的订阅方案分为三档：标准版连续包月68元、包年688元；加强版连续包月200元、包年2048元；专业版连续包月500元、包年5088元。目前订阅服务尚处测试阶段，豆包官方对此回应称，“豆包始终提供免费服务，在免费服务的基础上，豆包也在探索推出更多增值服务，以满足不同用户的差异化需求。”

据接近豆包的人士透露，付费功能将主要聚焦于PPT生成、数据分析、影视制作等复杂任务和生产力场景，免费版则继续面向日常轻量使用。

这一步的意义不止于豆包自身。作为国内月活规模最大的AI应用，豆包的付费探索，既是一次商业模式的自我验证，也将成为观察国内用户AI付费意愿的公开试验——它背后的逻辑、竞争格局的连锁反应，以及与全球AI商业化浪潮的关系，值得逐一拆解。

豆包为何在此时启动付费订阅？

豆包选择在此时启动付费订阅，是技术投入、用户基础、需求分层与行业趋势共同驱动的结果，背后有清晰的商业逻辑支撑。

首先是持续攀升的成本压力。据媒体报道，字节跳动2025年净利润同比下滑超70%，2025年三四季度大幅加码AI全链条投入是主要原因。对此，抖音集团副总裁李亮在微博发文澄清，称该数字基于国际会计准则，实际经营利润率仅“小幅下滑”，“远没有报道中这么大幅度”。但他同时确认，“抖音电商增速放缓和新兴业务相关投入增大”确实对下半年经营利润率造成了压力。

在具体产品层面，豆包大模型日均Token使用量截至2026年3月突破120万亿，三个月内翻了一倍，较2024年5月发布时增长了1000倍，算力成本的消耗以肉眼可见的速度攀升。随着Seedance 2.0全面开放，专业用户在视频生成等场景的算力需求进一步抬升，如何在不同产品线之间合理分配算力，已经是摆在字节桌面上的现实问题。

据不少用户反映，豆包此前已对专家模式、超能模式设置了使用额度限制，无限度的免费供给已难以为继。C端订阅付费，是覆盖成本、实现投入产出正向循环的直接路径。

其次，行业领先的用户规模与心智渗透率，为付费落地提供了底气。QuestMobile数据显示，截至2026年3月，豆包月活接近3.45亿，日活约1.4亿，月人均使用次数达54.8次。花旗研究Innovation Lab于2026年3月对1800名受访者开展的专项调查显示，豆包以79%的用户渗透率领跑国内AI应用市场，“最常用产品”占比达63%。

在用户心智上的领先地位，是豆包推进商业化最重要的筹码。

再者，国内AI用户需求已出现明确分层，差异化商业模式正在成为行业共识。上述花旗研究调查同时揭示了典型的“高渗透、浅使用”格局：83%受访者日均使用时长不足一小时，仅5%超过两小时。

绝大多数用户的基础需求，免费版完全可以覆盖；但少数重度、专业用户对高阶能力有强需求，付费意愿也更强——45%的受访者愿意为高级功能付费，可接受的月均订阅价格均值为48.3元，高于音乐和视频等典型数字内容订阅价格。

豆包通过“基础免费+高阶付费”的模式，可将优质Token资源向高价值用户倾斜，专家模型、视频生成等有次数限制的功能，付费用户将享受更高用量，高峰期排队的热门功能也将引入分流机制。

与此同时，豆包在电商方向的布局正在同步推进。2025年10月起，豆包陆续接入抖音商城、上线商品卡功能，并打通本地生活服务链路；2026年3月进一步实现应用内购物闭环，测试“对话即购物”模式——用户在对话中表达消费意图，豆包直接给出商品推荐并完成下单。

这条路线的逻辑是：免费用户可以通过消费行为产生商业价值，AI入口由此转化为电商流量的新触点，两条线并行，形成分层商业闭环。这一路径已被OpenAI的商业化探索验证——其近期推出的“广告换低价”模式与ChatGPT Go低价版，正是基于用户分层的商业化设计。

三档阶梯定价体系本身，也透露出豆包对用户群体的深度数据洞察。从68元到500元的月费跨度，精准覆盖了从普通进阶用户到专业人士的不同需求层次。

68元这个起点颇值得玩味：它既没有向国内视频网站的月费看齐，也没有直接按20美元/月的国际主流订阅价做汇率换算，而是接近于ChatGPT Go的8美元档位——据The Information报道，OpenAI正将这一平价版会员作为美国市场以外的主推付费产品，视其为全球最大公约数。

豆包的起价或许也经过了类似的市场测算，在用户付费意愿与商业回报之间找到了一个现实的平衡点。

02 豆包开始“收费”

如何搅动AI市场格局？

豆包开启付费订阅，搅动的不只是自身的商业化节奏，对国内AI应用竞争格局与行业发展产生的影响也不易低估。

首先值得关注的，是这件事对豆包自身基本盘的影响。花旗研究的调查数据已经说明，国内AI用户中轻量使用者占绝对多数，这部分用户的日常需求免费版完全可以承接，他们大概率感受不到任何变化。

基础版持续免费的承诺，在一定程度上也封堵了竞争对手拿“豆包要收费了”做文章的空间，不过市场格局是否会因此松动，最终还要看付费功能落地后的实际体验。

对于专业用户群体来说，这次变化的意义可能比想象中更大。付费高阶功能的推出，或许会改变行业对豆包“娱乐化、大众化”的固有认知，推动市场重新评估其在复杂生产力场景中的真实能力。

值得期待的是，收费本身可能倒逼豆包拿出更多压箱底的能力——不只是在用量上放宽限制，而是真正释放基座模型的上限，让满血版豆包在通用能力上展示出新的可能性。

对于Kimi等已落地订阅制的产品而言，豆包凭借庞大的用户基数与字节的技术支撑入场，多少会挤压其付费用户的增长空间。

竞争对手这边，千问、元宝等产品或许会借机以“免费”作为差异化卖点，但这张牌能打多久，还要看双方在具体场景下的体验差距。在视频生成等高算力场景，HappyHorse 1.0与Seedance 2.0仍存在一定差距；其他场景上各家模型能力各有千秋，短期内纯靠免费策略能否有效截流豆包的专业用户，仍有待观察。

对于整个国内AI行业而言，豆包的这次尝试是一次真正意义上的商业化试验。长期以来，“C端用户愿不愿意为AI付费”始终是悬而未决的核心问题，行业缺乏一个足够大的样本来验证。

豆包作为国民级AI应用，其付费转化率、用户留存与ARPU值表现，将直接为这个问题提供答案，也将探明国内AI付费服务的潜在用户规模天花板。这次尝试的结果，无论走向如何，都将为国内大模型厂商提供宝贵的实践经验。

03 全球AI商业化加速，订阅模式能否落地中国？

豆包开启付费订阅，并不是字节一家的动作，而是2026年全球AI行业商业化全面加速的集中缩影。

这一行业转向，有着坚实的底层支撑。根据Xsignal AI Holo数据库的季度报告，2026年Q1全球AI应用MAU已突破27亿，其中中国贡献了逾50%的新增量，中国AI应用月活达8.51亿，季度增速51.38%。用户普及的高峰期已经过去，免费获客的边际效益趋近于零。

与此同时，全球AI市场头部格局高度固化，国内也形成了以豆包、千问、DeepSeek为核心的稳定竞争梯队——在这种格局下，继续靠纯免费策略抢份额的必要性已大幅降低。OpenAI、Anthropic等头部厂商冲击上市的资本市场压力，则进一步加速了商业化的紧迫性。

AI对工作和生活的深度介入，也让用户的依赖程度远超一般内容消费类产品。一家海外60多人的初创公司被Anthropic莫名封禁全部账号，直接导致业务停转，CTO在X上发帖后迅速引发舆论发酵。这个极端案例折射出AI工具已深度嵌入生产流程——这种依赖程度，为付费转化提供了现实基础，也让AI产品的用户粘性远超Netflix等流媒体平台。

在这一背景下，海外头部厂商已全面开启商业化提速。OpenAI近期官宣效仿Netflix，推出“广告换低价”模式，上线低价版ChatGPT Go。OpenAI预计ChatGPT Go年内用户规模将突破1.12亿，2026年广告收入目标达25亿美元，2030年进一步扩大至1000亿美元，完成从精英生产力工具到全民信息入口的定位转型。

谷歌则在财报电话会议上明确释放信号，首席商务官Philipp Schindler表示“广告一直是将产品规模化、覆盖数十亿用户的重要手段”，Gemini的广告商业化计划已进入筹备阶段。Anthropic则聚焦高价值专业市场，据Xsignal数据，Claude 2026年Q1月活增速达287%，Claude Code推出六个月内年化营收率已达10亿美元。

国内厂商走的是另一条路。与海外“广告+订阅”双轮驱动的模式不同，国内头部AI产品普遍选择依托自身生态来消化流量价值。豆包背靠字节的抖音电商和本地生活体系，通过场景协同转化免费用户；千问则联动阿里商业生态，推出外卖、打车等生活服务，把AI入口直接接进了消费场景。

国内巨头本就拥有成熟的商业化基础设施，AI产品与其说是独立的变现主体，不如说是整个生态的流量入口和场景触达工具。广告模式在这套逻辑里并非不可能，但在竞争仍处白热化、各家都在争夺用户心智的阶段，率先引入广告的体验代价，可能远大于短期的收入收益。

订阅模式的落地，意味着国内AI商业化的逻辑正在悄悄发生转变。豆包作为国产AI应用的头部玩家，它迈出收费这一步，本身就有示范意义——后面的同行有了参照，整个行业才有可能走出靠倾销换规模的怪圈，进入一个更健康的商业周期。

用专业功能服务付费用户，用商业收入反哺模型能力，免费用户最终也能受益，这套逻辑在ChatGPT、Claude身上已经跑通，豆包现在要做的，是验证它在国内市场同样成立。

如果AI真的像水电煤一样常态化接入千家万户，订阅开销迟早会成为每个人账单上固定的一行。豆包此次付费尝试的结果，将成为整个行业观察国内用户AI付费意愿的第一块真正意义上的试金石。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

由豆包付费想到，AI到底会长成一门什么生意

Post published:2026-05-06

（本文作者为吴怼怼，钛媒体经授权发布）

文 | 吴怼怼

免费获客阶段结束，AI 应用开始进入“成本分层 + 用户分层 + 商业化验证”阶段。

最近，豆包 App Store 页面出现了付费订阅信息：免费基础版之外，可能会有 68 元/月标准版、200 元/月加强版、500 元/月专业版，年费最高 5088 元。

豆包回应是免费服务会继续保留，增值服务方案仍在测试中，当前产品内还没有正式展示相关权益。

这件事可以从几个层面看。

01 这和成本有关，尤其是“重度使用者成本”

豆包这种产品最麻烦的地方在于：用户越喜欢用，平台成本越高。

一个普通用户偶尔问几句话，成本可能可控。

但如果用户开始做这些事：

写长文、生成 PPT、做数据分析、深度研究、图片生成、视频生成、语音实时对话、Agent 多步执行任务。

那就完全不是一个成本等级了。

豆包 Mac 版主打的能力除了聊天，还有“搜索、P 图、写作、翻译、PPT、数据分析”，并且强调图片与视频生成、深度研究、会议纪要、文档表格处理等一站式工作流。这些功能本质上都比普通聊天更吃 token、更吃推理、更吃多模态算力。

所以豆包收费，很大概率不是因为“普通聊天亏得受不了了”，而是因为：

高价值能力和重度用户，不能再无限免费供应。

免费版可以继续存在，用来做入口、日活、品牌心智；但真正消耗大的能力，要通过会员、额度、优先级、专业版来分层。

02 AI 的商业化难点，是“收入固定，但成本浮动”

订阅制有一个天然矛盾：

用户每月付的钱是固定的，但用户消耗的 token 不是固定的。

这和奈飞、腾讯视频、爱奇艺还不一样。视频平台一部剧拍完，用户多看几次，边际成本相对有限。AI 不一样，用户每一次深度对话、每一次生成视频、每一次长上下文分析，都要重新占用推理资源。

传统软件模式以及奈飞模式更像：

研发一次→ 复制无限次 → 多卖一份的边际成本接近 0

但大模型服务更像：

研发模型一次→ 每次调用都要算力 → 用户越多、用得越深，推理成本越高。

OpenAI、Azure OpenAI 等 API 都是按 token 收费，本质上就说明了这一点：输入 token、输出 token、长上下文、缓存输入都有不同价格，输出 token 通常明显更贵。

OpenAI 官方定价页里，GPT-5.5 短上下文是输入每百万 token 2.5 美元、输出每百万 token 15 美元，缓存输入则低很多。

这和卖 Office、卖 Photoshop、卖操作系统不是一类经济模型。

字节自己的火山引擎也能看到类似逻辑：豆包模型面向开发者的价格同样按百万 tokens 计费，例如 Doubao-Seed-2.0-pro 显示为 3.2 元起/百万输入 tokens、16 元起/百万输出 tokens。

这说明一个本质问题：

AI 产品看起来是会员订阅，后台却是按量消耗。但它也不完全等同于餐厅。

更准确的说法应该是：

AI 是“软件公司 + 云计算公司 + 电力密集型实业公司”的混合体。

如果一个用户每月付 68 元，但疯狂生成 PPT、视频、长报告，成本可能吃掉大部分收入。

如果一个用户每月付 500 元，但主要用来做高价值工作，消耗可控，那就是好生意。

所以 AI 订阅本质是在做一件事：

把不可控的算力成本，转化成可预测的收入结构。

03 从“用户规模竞争”转向“ARPU 竞争”

之前国内 AI 应用竞争，很大程度上是免费抢用户。

豆包为什么能做得大？除了产品有优势，当然还因为字节有流量、产品能力强、免费门槛低。豆包是中国使用最多的 AI 聊天应用，QuestMobile 数据显示其周活跃用户约 1.55 亿，DeepSeek 约 8160 万；同时阿里也通过大额补贴拉动 Qwen 用户增长。

但免费模式有一个问题：

用户规模越大，成本压力越真实。

尤其是中国 AI 产品现在还有价格战。DeepSeek 把模型成本预期打得很低，阿里、字节、腾讯、百度又都不愿意丢入口。于是消费端 AI 很容易陷入一种尴尬：

用户觉得 AI 应该免费；
平台知道 AI 不可能无限免费；
投资人想看增长；
公司内部想看商业闭环。

豆包推出付费版，意味着它想测试一个问题：

中国用户到底愿不愿意为 AI 工作流付钱？

不是为“聊天”付钱，而是为“帮我省时间、做 PPT、写报告、做研究、处理数据、生成视频”付钱。

这个差别很关键。

用户很难为“你陪我聊天”每月付 500 元。

但如果它真能帮一个内容从业者、销售、老师、学生、运营、咨询顾问每天省 1—2 小时，那 68 元、200 元、500 元的接受度就完全不同。

04 这也说明：AI 免费版会保留，但免费版会越来越“有限”

未来国内AI 原生应用大概率不是一刀切收费，而是四层结构：

第一层：免费版

用于获客、建立使用习惯、保持市场份额。普通聊天、基础问答、轻量搜索会继续免费。

第二层：低价会员

给普通高频用户，比如更高额度、更快速度、更少排队、更好的模型。

第三层：专业版

给内容创作者、职场用户、学生、程序员、研究人员，卖的是 PPT、数据分析、深度研究、文档处理、代码、长上下文。

第四层：企业/API/Agent 服务

按量计费，或者套餐 + 超额计费。这里才是真正能跑商业模型的部分。

豆包现在传出的 68、200、500 三档，本质就是在试探这个分层。

免费版解决“用户规模”；

标准版解决“轻度付费”；

加强版和专业版解决“重度用户成本回收”。

ChatGPT、Claude、Gemini、Kimi、通义、智谱、豆包，都已经或者即将走向类似结构。区别只在于：谁的免费版最强，谁的付费权益最有感，谁的成本控制最好。

05 为什么AI 订阅比传统 SaaS 难？

AI 多一个用户、多一次对话、多一次长文总结、多一次 Agent 执行任务，就要多消耗 GPU 推理、电力、显存、带宽、存储和工程运维。

所以 AI 应用公司最核心的问题不是：

有没有用户？

而是：

用户越多，是越赚钱，还是越烧钱？

这点和传统 SaaS 很不一样。传统 SaaS 一旦系统搭好，新增客户的毛利通常很高；但 AI 产品如果用户特别爱用，反而可能带来更高推理成本。现在市场担心 Big Tech 的 AI 投入回报，本质也是这个问题。Alphabet、Microsoft、Meta、Amazon 等大厂今年 AI 相关投入规模巨大，投资者开始更关注这些 AI 支出什么时候能带来足够回报。

但是AI订阅当然也不能简单类比为餐厅，餐厅很难让“一碗面”的成本每年下降 80%。

但 AI 可以。

因为模型推理成本会被几件事不断压低：

第一，芯片变强。
第二，模型变小、蒸馏、量化、MoE 路由更精细。
第三，缓存、批处理、上下文复用会降低重复计算成本。
第四，很多任务不需要最强模型，可以用小模型完成。
第五，企业会从“盲目堆 token”转向“每个业务结果消耗更少 token”。

所以 AI 的边际成本不是 0，但它也不是固定不变的食材成本。

它更像早期云计算：刚开始很贵，但规模、硬件和软件优化会持续压成本。

这也是为什么 OpenAI 定价里“缓存输入”比普通输入便宜很多。缓存机制存在，本身就说明 AI 服务商在努力把重复计算变成更低成本的类软件化环节。

这就导致 AI 公司需要同时回答三个问题：

第一，用户愿意付多少钱？
这是收入端。

第二，用户每月会消耗多少 token？
这是成本端。

第三，模型成本下降速度能不能快过使用量增长？
这是利润率端。

如果答案是：

用户愿意付 200 元，但每月消耗 150 元成本，那这个生意很一般。

如果答案是：用户愿意付 200 元；，成本只有 20 元，而且随着模型优化还能降到 10 元。

那 AI 应用又重新接近一个好软件生意。

所以 AI 商业模式真正的核心指标不是 DAU，也不是下载量，而是：

每个付费用户的收入 / 每个付费用户的推理成本。

也就是 AI 版的单位经济模型。

06 这会反过来影响AI 行情

联系到股市，这件事其实很重要。

市场现在交易 AI，第一阶段看的是：

算力需求会不会爆发。

所以英伟达、台积电、博通、存储、电力设备、数据中心涨。

第二阶段市场会问：

AI 应用有没有用户。

所以 ChatGPT、豆包、Kimi、Qwen、Copilot、Gemini 的用户规模会被关注。

第三阶段，也就是接下来最关键的阶段，市场会问：

这些用户能不能付费？付费之后能不能赚钱？

豆包传出收费，其实就是第三阶段的开始。

如果未来看到这些信号，AI 行情会更健康：

付费转化率不错；
用户没有因为收费大规模流失；
高价专业版有人买单；
企业客户开始规模化采购；
推理成本持续下降；
AI 功能带来真实提价能力。

但如果看到相反信号：

用户只愿意免费用；付费版口碑差；
平台不断降价促销；
高频用户把成本打爆；
AI 应用收入增长快但毛利率不好；

那市场就会开始怀疑：

AI 应用层是不是一个好生意？

这会进一步传导到上游。因为如果应用层赚不到钱，云厂商和模型厂商就会被问：你们为什么还要持续加大 capex？

07 不同AI 公司，经济模型完全不一样

还有一个问题是，不能把所有 AI 公司混在一起看。

这些是卖铲子的。

别人用 AI 越多，它们越赚钱。

它们不用直接承担终端用户 token 成本，反而吃的是 AI 推理和训练扩张带来的资本开支。

它们介于中间。

一方面，AI 带来云收入增长；另一方面，它们自己要承担巨额 capex、折旧、电力和数据中心成本。Reuters Breakingviews 提到，大厂 AI 开支正在大幅扩张，但市场也越来越关心这些投入能否形成清晰回报。

所以云厂商的问题是：

AI 云收入增长，能不能覆盖数据中心、GPU、折旧和电力成本？

用户用得越多，成本越高。

如果是固定订阅制，比如每月收一个固定价格，但用户疯狂使用，那毛利率会被吃掉。

所以 AI 应用最理想的状态不是“用户无限聊天”，而是：

用户愿意高付费，但实际 token 消耗可控。

比如企业愿意为一个 AI 销售助手、AI 代码助手、AI 法务助手每月付 30、50、100 美元，但它背后的推理成本只有几美元，那就是好生意。

比如微软、Adobe、Salesforce 这类公司，如果能在原有软件上加 AI 功能，提高 ARPU，但不让成本失控，它们就能把 AI 变成提价工具。

AI 对它们不是重新创业，是原有软件分发渠道 + AI 加价包。

08 所以AI 最大的估值分歧就在这里

完全不必争论AI 有没有用，有没有未来，AI当然是未来。

更深层的问题是：AI 到底是高毛利软件，还是重资本实业？

乐观派认为：

AI 成本会快速下降，应用会爆发，ARPU 会上升，最后它还是软件式高毛利生意。

悲观派认为：

AI 会变成军备竞赛，大家都要买 GPU、建数据中心、付电费，但用户未必愿意为每个 token 付足够高的价格，最后利润被基础设施成本吃掉。

我觉得真相在中间：

基础模型和云基础设施会越来越像重资产行业；真正有分发、有场景、有定价权的 AI 应用，才有机会重新变成软件生意。

09 这也解释了为什么AI 行情可能会分化

第一阶段，市场买的是：

谁和 AI 沾边，谁涨。

第二阶段，市场会问：

谁能把 AI 变成收入？

第三阶段，市场会继续问：

谁能把 AI 收入变成利润和自由现金流？

AI 不像传统软件那样“多卖一份几乎零成本”，它每次服务都要消耗算力，所以天然带有餐厅、云计算和实业公司的成本属性。

但 AI 也不像餐厅那么线性，因为模型优化、缓存、芯片进步、批处理、小模型路由，会让单位成本持续下降。

所以 AI 商业模式真正要看的不是“有没有收入”，而是：

每一美元AI 收入背后，需要烧掉多少 GPU、电力和 token 成本。

这就是接下来市场会反复拷问 AI 公司的核心问题。

AI 的未来，到底有多少利润率。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

Post published:2026-05-06

今日，Steam官方手柄Steam Controller正式开售，而据GamesRadar+报道，尽管Valve此前曾表示产品“首发时有充足的库存”，但在开售的瞬间依旧被挤爆，产品被抢购一空。

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

报道称，本轮手柄预订原定于今天凌晨一点，但就玩家社区的反应来看，Valve实际上提前了几分钟。

而在开售后，订单瞬间涌入，Valve服务器立刻不堪重负，大量玩家在尝试下单时不断遭遇报错，根本无法完成购买。

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

仅用了大约35分钟，这款手柄的官方订购页面就显示“缺货”（至少在北美地区）。

有些玩家在不断刷新和重试后幸运下单成功，但对大多数人来说，这一轮首发基本已经结束。

虽然期间偶尔会因为订单取消而短暂补货，但整体来看，首批库存已经彻底售罄。

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

当然，玩家们依然可以“轻松”买到Steam手柄——前提是愿意支付溢价。

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

据介绍目前eBay等平台已经充斥着黄牛转卖，且确实有买家在高价成交。

尽管社区普遍呼吁不要助长黄牛行为，但仍有不少标价200美元（折合人民币约1366元）以上的商品已经售出。

作为参考，Steam手柄的官方定价为99美元（折合人民币约676元），黄牛价翻了一倍。

Steam手柄卖爆！35分钟售罄服务器崩溃黄牛价1300

35分钟售罄、服务器直接被冲爆，这热度确实离谱。

但另一边，黄牛直接把价格翻倍甚至更高，居然还有人买单——到底是产品真香，还是玩家太容易被“割”？

抛开黄牛不谈，单看原价，你觉得这款Steam手柄到底值不值这个价？你会为这款手柄买单吗？评论区说说你的判断。