百万上下文之后,拼什么?

(本文作者为 科技不许冷,钛媒体经授权发布)

文 | 科技不许冷

过去几天,科技圈的视线全被DeepSeek吸走了。

满屏都是传闻中的估值溢价,或者是跟各类国产算力芯片的适配通稿。市场的狂热情绪,很容易让人迷失在庞大的数字迷宫里。大众的关注点,要么是百万上下文“这个听起来很唬人的标签,要么是跑分榜单上“谁又赢了谁零点几分”的算术题。

DeepSeek V4-Pro的分数确实好看。从其技术报告披露的底牌来看,在SimpleQA-Verified测试中,它以20个绝对百分点的优势甩开了所有开源对手;在Codeforces代码竞赛里,预期评分直接追平了GPT-5.4。当然,在世界知识的广度上,它依然略逊于Gemini-3.1-Pro;遇到极高难度的复杂任务,跟Claude Opus 4.6也还有微小的身位差。

但这都不重要。

如果你只盯着榜单排名,就完全看漏了这家机构真正的野心。

DeepSeek根本不是在发布一个用来刷榜的模型参数包。它实际上是在一点点拆开“百万上下文”这件事的底座。

大模型的战争,已经从模型层退场,全面接管系统层。

过去几年,行业都在拼脑容量。比谁的参数多,比谁跑分高。但这套玩法到头了。V4的出现,是在定义一套新规矩:模型本身,只是高效工程系统自然结出的一个副产品。

1M上下文变成所有官方服务的出厂默认值时,从其开源实现中可以清晰地看到一个事实:这绝对不是靠算力硬堆出来的。长文本时代的下半场,拼的从来不是智商。

而是机房调度能力。

13B激活参数,把37B按在地上

调度能力从哪看出来?先看V4最反直觉的一个设计:Pro和Flash的共生关系。

行业里一看到“Pro”和“Flash”,第一反应就是精准刀法:Pro用来打标杆,Flash用来做下沉市场,收割中小企业。

这种典型的商业包装逻辑,放在V4身上,看偏了。这两者根本不是算力降级关系,而是验证同一套底层逻辑的对照组。

大模型过去的长文本能力,本质上是用显存硬堆出来的伪能力。只要给的GPU够多,显存够大,不管多长的文本都能硬吞下去。但代价是,成本高到根本没法在真实的商业环境里铺开。

V4-Pro以1.6T的总参数和49B的激活参数把容量拉到了顶。但真正的大招,是那个只有284B总参数、13B激活参数的V4-Flash。

文档里的一个数据直接戳破了行业的窗户纸:在大量极具挑战性的测试中,只有13B激活参数的Flash-Base,直接超越了上一代37B激活参数的V3.2-Base。

13B的极小激活代价,绝不是能力缩水,而是一次底层的效率重构。Flash的意义,不是为了证明它能有多省钱,而是为了证明“算力霸权是可以被架构重构打破的”。

参数规模,已经彻底失去决定性意义。

调度能力,正在取代参数,成为新的主战场。这让百万上下文不再是高阶英伟达集群的专属玩具,国产芯片也能顺畅地接管战局。未来开源模型的分水岭,不再是看谁的底座大,而是看谁能用十分之一的力气干同样的活。

专家和稀泥,不如各管一段

硬件效率是一面,另一面是软件效率。V4在’后训练’阶段也换了一条路。

大模型的“后训练”阶段,过去一直走在一条死胡同里。

行业惯用的混合强化学习(Mixed RL),说的直白点,就是和稀泥。如果你想让模型既懂微积分,又会写C++,还能做日常规划时,传统的做法是把所有的参数强行往中间捏。结果就是“向均值回归”。

强行捏在一起,特化能力全磨平了,最终只会均值化成平庸的通才。

V4换了一条路。不是改良,是彻底换道。技术报告里交代了新解法:先独立培养专家。数学专家就只管算数,代码专家就只管编程。把单一维度的能力拉到满。

关键在于最后怎么合并。V4不用业内泛滥的参数平均法,而是用了同策略蒸馏(OPD)。

传统的权重合并是一种静态妥协,而OPD是一场动态接管。

统一模型在自己生成轨迹时,遇到数学题,系统就精准引入数学专家的梯度来指路;遇到写代码,就无缝切给代码专家。大家各司其职,不在参数层面打架。

顺着这条线往下看,V4应用端那个很火的“三种推理模式”(无思考、高强度思考、极限思考),根本不是加了个UI按钮那么简单。它是OPD机制在产品端的直接变现。

在极限思考模式下,底层提示词会强制模型去分解问题、穷尽边缘情况。这种极其固执的死磕行为,恰恰是在OPD阶段,在“数学专家”和“编程专家”的高强度捶打下固化下来的本能。

OPD不搞平均。遇到数学题,接数学专家;遇到代码,接代码专家。各管一段,不在参数层面打架。

Agent跑了三小时,不能失忆

换完训练方法,换应用场景长上下文到底能干嘛?

如果只是为了在十万字的研报里找一句话,那不叫长上下文,那叫高级检索。真实的商业场景里,Agent要替你重构代码、跨系统验证数据、甚至跑一整晚的流程。

在这个过程里,最致命的问题是“失忆”。

V3.2有个让工程师极其头疼的痛点:新消息一进来,模型之前的思考痕迹直接清空。普通聊天这么干没问题,省资源。但如果是跑了三个小时的Agent任务,半路插进去一句话,模型脑子一白,整个状态全部丢失,得从头算。

这种链条断裂,在实际业务中直接接不住。

V4给出的方案是“交织思考”。逻辑很冷酷,分场景算账。

只要是带工具调用的长程场景,跨越消息边界,推理链条完整保留。如果是闲聊,继续清空,绝不多浪费一丁点算力。模型开始真正懂得“在什么场合,该记住什么”。

更绝的是它的快速指令(Quick Instruction)。

以前行业里做意图识别,都习惯在外面挂个小模型。这意味着每次有新请求进来,不管长短,系统都得把用户的提示词重新嚼一遍。这本质上是在白白浪费预填充计算。

V4没这么干。从其开源代码中可见:直接在输入序列末尾插几个隐式指令。主模型之前算好的海量特征(KV Cache),直接复用。

长上下文的核心问题,从来不是“记得多”,而是“算得起”。

这其实就是粗暴地砍掉了一次冗余的预填充计算。行业默认一个功能配一个小模型,V4用行动证明:不用。KV Cache复用吃透了,长程Agent才能跑起来。

完全缓存、定期存、不存,都疼

能跑不代表能卖

第17页有个细节,自动生成的kernel,跟手写CUDA逐位比对。不是差不多,是每一位都一样。这种工程洁癖,业务里少见。有这底线,才敢算部署账。

高并发的百万上下文,拼的根本不是大模型懂不懂人类,拼的是你懂不懂硬件的物理极限在哪。

文档里三种调度策略都列出来了,没有藏着掖着,全是取舍。

想追求计算零冗余?上“完全缓存”。但代价是,固态硬盘的I/O通道可能在几秒钟内被高频写入直接挤爆。

想保护硬盘?上“定期检查点”。隔一段距离存一次。硬盘保住了,但GPU得时不时腾出算力来给丢失的尾部数据擦屁股。

要是干脆不上物理硬盘缓存呢?那就选“零缓存”。省下全部存储带宽,全靠长程特征做锚点,碰到问题GPU现场硬算。

这三条路,哪条都不是完美的。这本质上就是一场关于硬件寿命、并发峰值和用户延迟容忍度之间的极限算账。它把冷冰冰的现实摆在所有人面前:AI早已不是单纯的算力密集型产业,它正在加速变成调度密集型产业。

写在最后

DeepSeek V4,如果还停留在跑分榜上,那就连门槛都没摸到

OPD的能力动态接管,交织思考的记忆保留,砍掉预填充的快速指令,还有那些把硬盘和显存算计到骨头里的落盘策略。

这些枯燥的细节,其实是一根线上的蚂蚱。

大模型在变。

不再是陪聊的玩具。

而是开始接管真实世界的业务链条。

DeepSeek不是在赌未来,它是在建机房。外界还在聊分数分数只是机房运转时的副产品

当对手还在为跑分榜上的零点几分沾沾自喜、向市场炫耀那几百亿参数时,DeepSeek已经在算每百万Token的电费

战局已经很清晰了:

下一场长文本战争,决胜点不是智商是机房成本。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading百万上下文之后,拼什么?

剂泰科技IPO:115亿港元押在首付款之后的持续性上

(本文作者为 舒书,钛媒体经授权发布)

文 | 舒书

剂泰科技5月5日正式启动公开招股。发行价10.50港元,全球发售2.01亿股H股,募资约21亿港元。发行后总股本约11亿股(根据公开信息推算,以招股书最终披露为准),发行市值约115亿港元。

18家基石机构认购1.48亿美元(约11.59亿港元),占发行规模约54.9%。基石比例超过50%,在港股生物科技IPO中偏高。2024年港股18A生物科技公司IPO的平均基石占比约40-60%,54.9%落在此区间上限附近。但高基石占比不一定完全代表机构抢筹,也可能是公开发售认购偏弱下的定价平衡。超额认购倍数才是真正的测温计——若公开发售部分超额认购倍数低于5-10倍,54.9%的基石占比更像是包场式托底,而非市场热捧。

贝莱德领投5000万美元,UBS、韩国未来资产、日本欧力士跟进,国新基金首次出手AI制药,高瓴、IDG、华登国际同步入局。

一、基石图谱:五类资本,五套定价逻辑

基石投资者五类同框并不意味着五类资本都看好了同一个故事。每类资本对剂泰的定价逻辑完全不同:

资本类型

代表机构

投资逻辑

国际资管

贝莱德、UBS、韩国未来资产、日本欧力士

押注AI纳米递送平台的全球竞争力,要求年化15-20%回报

国家级基金

国新基金(首次出手AI制药)

战略信号意义,不等于国家托底

专业医疗基金

Deerfield、RTW、清池资本

验证技术临床价值,尽调周期12-24个月

AI科技基金

华登国际、高瓴、IDG

看重NanoForge平台的跨行业延展性,持有周期5-7年

中资公募

广发、工银瑞信、华夏、富国

二级市场接受度信号,但有从众跟投特征

国际资管(贝莱德、UBS、韩国未来资产、日本欧力士) 的投资逻辑是押注剂泰能否成为亚洲的Moderna——AI递送平台一旦跑通,其跨赛道复用的基础设施属性,估值弹性极大。但它们通常要求年化回报率在15-20%,且对商业化兑现时间表非常敏感。如果剂泰在上市后12-18个月内未能落地第二笔大额BD或平台订阅收入,国际资管的持仓意愿可能迅速逆转。

国新基金作为央企战新基金旗下独立运作的市场化基金,其投资决策有明确的战略导向性。央企战新基金首期510亿元,明确投向生物医药等战略性新兴产业。国新首次涉足AI制药领域,标志着国家级资本已将AI药物递送纳入视野。但这只是“信号”,不是“托底”。国新基金的尽调周期通常为6-12个月,投资金额在基石中的具体占比将直接影响“信号”的强度——若国新仅贡献5-10%的基石额度,其信号意义不应被过度放大。

Deerfield等医疗专项基金的尽调以严苛著称,通常审查12-24个月的临床前数据、靶点选择逻辑、监管路径可行性。它们出现在基石名单中,是对MTS-004临床进度的背书,尤其是对其III期试验数据的完整性和符合pre-NDA申报要求的认可。

高瓴、IDG等AI科技基金看重的是平台复用性。NanoForge覆盖8个关键器官和组织的精准靶向递送,这项技术不止于制药——动物健康、抗衰老、医美等领域都有延展空间。这类基金的持有周期通常为5-7年,对商业化的容忍度高于国际资管,但也要求剂泰在平台跨行业落地上给出明确路线图。

中资公募罕见同框,往往是从众跟投的防御性配置占主导。公募基金在IPO阶段锁仓,通常约定6-12个月的锁定期,它们更关注剂泰上市首日表现和短期股价波动,对长期估值的判断权重较低。2024年港股生物科技IPO中,公募基石占比超过15%的公司,上市后6个月内股价破发率约为60%(统计样本为当年18家公司,破发指收盘价低于发行价)。这组统计样本量有限,不宜过度解读,但反映了高公募占比与短期破发之间的历史相关性。

基石图谱

二、财务基本面

财务

营收结构:一次性收入占95%

1.05亿元营收中,约1亿元来自MTS-004对外授权的首付款,是一次性资产出售而非持续性收入。五大客户收入占比98.9%,第一大客户占比95.2%。扣除首付款后,经常性收入仅数百万元级别(主要来自CRO服务及其他平台合作)。2023年930万元→2024年150万元→2025年1.05亿元的过山车式曲线意味着:如果2026年没有新的里程碑事件触发,营收可能再次回落至千万级以下。

毛利率跃升:一次性事件

98.2%的毛利率是收入结构切换的结果——知识产权交易没有生产成本。一旦首付款确认完毕,毛利率会回归常态(2023-2024年水平约为55-60%)。剂泰是否会重返CRO服务模式,取决于2026年平台合作的推进节奏。

现金储备:最硬的底牌,但有时间约束

11.3亿元现金是剂泰最硬的底牌。对现金runway的计算必须同时考虑账面亏损和现金流两个口径:

  • 按经调整亏损1.8亿元计算,静态runway约6年
  • 按经营现金流流出约3.3亿元计算(经调整亏损1.8亿+非现金费用约1亿+营运资金占用约0.5亿),静态runway约3.5年
  • 若管线推进至临床后期,研发开支加速增长(临床II/III期成本通常为临床前的3-5倍),runway可能缩至2-2.5年

若MTS-004进入商业化准备阶段(销售团队搭建、市场准入),或新管线进入临床后期,烧钱速度可能从3.3亿/年翻倍至6-7亿/年,届时runway将缩短至1.5-2年。11.3亿元并不宽裕。

现金跑道测算

三、技术壁垒

NanoForge平台宣称拥有超1,000万种结构多元化的脂质库,已完成超过10万个湿实验数据点的验证。公司已备案217项专利申请,获授52项(来源:招股书及公开专利数据库)。

虚拟库vs真实库

1,000万种脂质,绝大部分是虚拟筛选库,属于已构建但未合成的理论潜力。已合成并经过实验验证的脂质,真实规模远低于1,000万。100:1的比例意味着验证全部虚拟结构还需要100倍的投入与时间。

按每个湿实验数据点成本约1万元估算(行业估算,含试剂、设备、人力。实际成本因实验类型差异巨大:体外细胞实验约0.5-2万元/点,体内动物实验约5-20万元/点,毒理实验50万元以上/点。剂泰10万数据点的具体构成未披露,此估算存在较大不确定性),从10万到100万需要约90亿元投入。剂泰账上现金11.3亿元,即使全部投入也仅能增加约11万个数据点。距离非线性加速所需的百万级数据规模,资金缺口是数量级的。

获授率约24%,在生物科技初创公司中处于中等水平(行业平均约20-30%)。但24%本身无法判断好坏——若因专利申请策略激进(大量申请,宽进严出),则是中性信号;若因技术新颖性不足或专利撰写质量差导致频繁驳回,则需要警惕。核心问题是:52项获授专利中,有多少覆盖NanoForge平台的核心算法或关键脂质结构?专利覆盖地域是否包含中美欧日韩等主要市场?这些信息招股书未详细披露。

数据飞轮的非线性拐点

真正的非线性拐点不是百万级数据规模,而是AI模型预测精度达到可大幅减少湿实验验证的水平。这需要的不是数据量的线性增长,而是数据-算法-湿实验三者之间形成更高效的反馈闭环。但招股书未披露AI模型的历史预测命中率及提升曲线,无法建立“数据集规模→预测精度”的定量关系。2026年4月,NMPA发布《关于“人工智能+药品监管”的实施意见》,明确构建AI辅助审评审批体系,但对AI预测能否替代部分湿实验数据尚无明确指引——这是数据飞轮叙事的监管不确定性。

技术壁垒

四、三小龙同台:95倍市销率的溢价从何而来

剂泰上市后,AI制药三小龙齐聚港交所。按2026年5月初汇率统一换算:

三小龙

剂泰的市销率约95倍,远高于晶泰(29倍)和英矽(41倍),是市场为递送基础设施故事支付的高估值溢价。按经常性收入约数百万元计算,调整后市销率将高达2300倍以上。

递送是几乎所有生物药的卡脖子环节——这是剂泰享有估值溢价的结构性理由。但卡脖子能否转化为高定价权,取决于三个条件:

  • 技术的不可替代性:NanoForge的靶向器官数量(8个)和递送效率是否显著优于LNP等现有技术
  • 专利布局的强度:核心专利的剩余有效期、覆盖地域、被挑战风险
  • 模仿难度:竞争对手能否通过挖角核心团队快速复制

这些条件中只要有一个不成立,溢价逻辑就会动摇。

五、跟踪清单

上市后12-24个月内,四个信号将决定剂泰的估值逻辑是否成立。剂泰的现金储备约可支撑24-30个月,信号一和信号二的验证窗口与现金runway匹配度较高,是剂泰最需要优先兑现的两个承诺:

信号

核心指标

预期时间

与现金runway匹配度

持续性收入

经常性收入占比是否提升至20%以上

6-12个月

匹配

续约模式

存量客户是否有续约或扩购案例

12-18个月

匹配

数据飞轮

湿实验数据点能否从10万增长至13-15万

12-24个月

⚠️ 部分匹配

管线多元化

是否有一条新管线进入临床II/III期

18-36个月

⚠️ 时间偏紧

关键跟踪信号

六、结语

115亿市值对应95倍市销率,市场的赌注是剂泰能在未来12-24个月内将一次性收入结构转化为持续性平台收入。这个赌注是否成立,四个信号将在不同时间窗口给出答案。

首付款是起点,不是终点。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading剂泰科技IPO:115亿港元押在首付款之后的持续性上

Palantir:软件末日论汹涌,最牛信仰股也松动了?

(本文作者为 海豚研究,钛媒体经授权发布)

文 | 海豚研究

Palantir Tech(PLTR.US) Q1 业绩整体仍然不俗,尽管连续的硬核业绩消化了一部分的估值溢价,但其中关于 “美国商业收入不及预期”和 “订单波动和指引增速趋势放缓”的两个瑕疵,叠加 AI 叙事的影响,还是削弱了资金短期做多意愿,财报反馈平淡。

具体来看:

1. 指引上调,但趋势要放缓?:Q1 收入继续加速增长 85%,公司对 Q2 的指引增长 79% 左右,全年收入预期上调到超 76 亿,同比增长 71%,均超卖方一致预期。但从后续增速有放缓趋势(Q2&H2),可能引发了买方资金的不满。

不过按照 Palantir 一贯 Beat 指引的习惯,二季度应该仍然有望实现加速增长。而 4 月以来的订单签约情况来看,全年高增长趋势应该也不会有太大问题。

2.“无惊喜” 的美国市场:Q1 美国客户收入整体翻倍增长,增速看依旧保持高景气度,公司对美国市场的依赖程度也提高到收入占比 78%。不过,虽然美国政府、美国商业收入的增速均很亮眼,但市场原先的预期要比实际更乐观。

(1)美国政府:国防部 “灯塔效应” 发挥影响,多部门采购

美国政府收入被视作 Palantir 的护城河,虽然是业绩托底的存在,但 Q1 超 84% 的增速依旧亮眼。

目前 Palantir 不只是存在于国防部的合同续期或新增项目中,还渗透到了能源部、财政部以及农业部的采购意向上。尤其是农业部,一季度和 Palantir 签下了 3 亿美金额度上限的合作框架。

(2)美国商业:狂飙 133%,但仍然 miss 预期

资金最关注的美国商业收入,可以说是估值向上的核心支撑点,虽然本季度依旧是高增长 133%,环比 Q1 的 137% 略有放缓,但不及更乐观的市场预期。市场预设的还是环比加速的起量趋势,财报前部分机构预期甚至达到了增长 140% 以上。

不过,管理层对全年美国商业收入给了增长 120%+ 的指引,这意味着下半年在显著更高的基数下,Palantir 在美国企业客户上的需求仍不低。

3. 国际需求意料之外的回暖:国际商业收入比较意外的出现了加速回暖,增长 26%。

Palantir 因为一直强调对美国优先、服务美国安全的长期经营战略,因此除了英国政府,国际政企出于安全目的,对采购 Palantir 产品服务都会有所犹豫。当下增长反弹,可能是因为吸引到更多全球企业的合作,以及上季度就已经推进的头部咨询机构合作,从而提高了产品和品牌跨市场的影响力。

不过在加速回暖的持续性上,海豚君认为还是谨慎乐观。CEO 的每一次 “本土保护主义” 发言,都可能会影响国际市场的进一步开拓。

4. 前瞻指标:政府需求稳定高景气、企业需求或存在新增放缓

(1)中长期视角关注 TCV、RPO、客户数量:一季度 TCV(总合同价值)同比增长 61% 达到 24 亿美金,增速环比有明显放缓。挑大梁的美国商业订单季度增速在上季度显著放缓下,继续滑落至 46%,表明当下新签合同主要在政府端。

一季度 RPO 依旧保持 134% 的高增速,TCV 和 RPO 增长趋势出现连续季度的偏离,也能同样说明合同额的短期增量主要是政府端:

RPO 表明剩余合同中已经明确锁单(无法取消)的金额,政府合同往往金额高、且不可取消的比例也相对较高(目前政府订单多来自美国和关系较好的英国,取消或违约可能性不高),因此往往会导致订单指标出现短期脉冲。比如去年 Q4,以及今年 Q1 美国政府就出现了多个部门(农业部、国防部、能源部、财政部等)对 Palantir 产品和服务的采购/续约,合同签署扎堆。

当然,新增订单情况存在一些季节性波动,但还是需要继续关注企业端订单情况,毕竟商业市场才是更容易支撑估值向上的关键。

Q1 客户数量整体净增 53 家,其中政府新增 1 个(合作部门),企业新增 52 家,44 家美国企业,8 家国际企业。

(2)短期上市场主要关注 Billings、NDR 变化:一季度 Billings 同比增长 93%,整体合同负债(含客户定金)环比净增加近 1.2 亿,环比增加。来自老客户的收入净扩张率 150%,环比继续提高,体现品牌心智提升和深入合作的趋势。

5. 业绩指标一览&订单新增情况

海豚君观点

Palantir 在当下的基本面整体上没有大问题,这代表后续的增长仍有希望保持高速,但由于高估值的原因,使得资金非常在意增速放缓,哪怕可能最后只是季节性波动。因此当 Q1 财报中,美国商业收入 miss、指引隐含增速放缓、总订单额 TCV 增速持续收敛下,至少赌财报的资金会离开。

但又因为此前软件股杀估值中,Palantir 也跟着消化了一些,因此一份整体看也不算差的财报,资金想要进一步大惩罚的意愿也有限,因此也就削弱了空头回补动力。

短期来看,虽然国际市场回暖,但海豚君认为,无论是短期业绩还是估值逻辑,都还是比较依赖美国市场(政府订单做托底,企业合同拉高想象力),但可以看到有一些客户的态度已经逐渐从参加 bootcamp 的试一试心理,转变为大规模放心合作:一季度的新合作中,除了政府订单,企业中的中长期合作也在明显增多。

而对于此前 Anthropic 等大模型的威胁,海豚君认为可能也无需太悲观去看:

Anthropic 发的两个产品,一个 Mythos 是定向部署的网络安全工具;另一个 Managed Agents 则是托管 AI Agents 运行时的基础设施,方便企业将现有大模型赋能到商业流程中。我们认为,不仅是应用场景的重合度偏差,这两个 Agents 与 Palantir 的 AIP 服务以及 Foundry 中的 Ontology 还是有真正实用性的差距。

这里面的关键在于 Palantir 是基于企业内部需求做的定制化部署,这里面不仅涉及到 Ontology 的设计(不同实体/元素、实体与实体之间的映射关系等),实现牵一发而动全身的效果(对企业面对的不同变化做出正确的跨部门决策),同时还涉及到企业内部不同数据复杂的授权范围,这是基于概率输出结果的通用 LLM 运作原理有根本差异的地方。

当然 LLM 也可以基于特定企业去做调试和定制,但这个需要铺专门的人力去配合企业完成,以及还需要一些 “小白鼠” 企业去做先行试验来做同样的效果背书。反过来说,在这一点上,Palantir 还有一些明显的先发优势和口碑认证的。

最后看看高估值通过不到一个季度的股价调整和业绩超预期增长,消化了多少:盘后 3412 亿市值,对应 26/27 年经调整经营利润分别为 76x/47x Adj.P/EBIT(已对业绩预期针对新的指引和增长趋势,做了显著上调,预计 26、27 年收入增速分别为 75%、60%,经调整经营利润率为 58%),相比年初接近百倍 PE 的估值消化了一部分,但仍然算是一个不低的估值水平,对高增长持续性的要求还是不低,这可能需要公司持续交出亮眼的业绩来支撑当前估值。

以下为详细分析

一、对美依赖度提升,但超预期在国际市场

一季度实现总营收 16.3 亿美元,同比增长 85%,超市场预期(~15.4 亿),增速继续环比上季度拉升。

Palantir 主要是向客户提供定制化的软件服务,因此收入在短期内可预期性较强,公司的指引区间也比较窄,隐含收入的确定性较高。不过海豚君两年跟踪下来,发现 Palantir 的 CEO 虽然在股东信中比较狂妄自信,但指引总会被业绩超过。

1. 分业务情况

(1)政府客户收入:订单扎堆,跨部门渗透

一季度政府客户收入同比增长 76%,增长主力依然是美国本土,继续环比加速增长。近两个季度多个美国政府部门与 Palantir 签署合同,比如农业部在 4 月直接确认了 3 亿额度的合同框架。

国际政府同样小幅加速,但应该主要是确认消耗之前的英国、德法政府合同,当下新增订单不多。

(2)商业市场:美企需求爆棚,国际企业需求回暖

一季度商业收入同比增速 95%,继续加速。其中:

美国本土企业收入继续狂飙 133%,但市场预期更高。老客户的使用粘性稳定提高,净美元留存率达到 150%(隐含过去 12 个月的老用户支付增长 50%)。

国际企业增长意外回暖,客户数也环比增加了 9 家,这里的反弹除了 Palantir 本身可能与全球头部咨询公司合作有一定关联。不过对于后续的持续性,海豚君仍然存在一些顾虑,打算再跟踪一段时间的国际企业合同情况。

二、前瞻指标情况:政府需求稳定高景气、企业需求或存在新增放缓

对于软件公司而言,未来的成长性是估值的核心。但每季度确认的收入,这个指标相对滞后,因此我们建议重点关注新合同的获取情况,主要表现为合同情况(RPO、TCV)、当期账单流水(Billings)以及客户数量的增加。

总体来看,Q1 前瞻性指标继续体现了政府需求的稳定,和企业需求的波动,

(1)剩余不可撤销的未履约合同(RPO):中长期合同大幅增加

一季度 Palantir 剩余合同额跃至 44.5 亿美元,环比净增加了近 3.7 亿。上季度包含了政府大单的脉冲影响,所以这个季度的净增是自然放缓,但增长仍旧不俗。

(2)当期账单流水(Billings)& 递延收入:健康,但也有放缓

一季度账单流水近 17.5 亿美元,同比 93% 的增长,也是受大订单的签订和打款。整体合同负债(含客户定金)环比净增加,老客户的付费规模扩张率 150%,环比继续提高,体现老客户粘性加强,升级付费的趋势。

(3)合同总价值(TCV):与 RPO 偏差印证政府订单扎堆、企业存在季节波动

一季度记录的合同总价值为 24 亿,同比增长 61%,环比减少 18 亿,增长再次放缓。TCV 与 RPO 的偏差,恰恰说明新增的合同中,签署即锁单(RPO)的政府合同占比较多。

(4)客户增量:美国企业贡献主要增量

而从最直观的客户数,也偏中长期指标,一季度环比净增 53 家,其中 52 家来自于商业客户(其中的 44 家是本地美企),1 家来自政府。

三、盈利能力继续创新高

一季度 Palantir 实现 GAAP 下经营利润 7.5 亿,三项经营费用中本季度销售费用、管理费用的增长有反弹,但仍然显著低于收入。最终带来 GAAP 下经营利润率环比提高了 6 个点,达到 46%,加回折旧和 SBC 后的经调整经营利润达到 60%,相比上季度也提高了 3pct。

Palantir 的现金流与合同打款有关,因此会出现季节间的波动。Q1 仍是订单爆棚的继续新增了不少合同订单,导致自由现金流通高增长 150%。管理层全年指引现金流 42-44 亿,截至一季度末账上已积存现金 + 短期投资达到 80 亿美金。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue ReadingPalantir:软件末日论汹涌,最牛信仰股也松动了?

豆包开启付费订阅,国内AI商业化迎来拐点?

(本文作者为 AI价值官,钛媒体经授权发布)

文 | AI价值官,撰 文丨星  野,编 辑丨美 圻

5月4日,豆包在App Store更新开发说明,新增订阅服务声明,“豆包付费”迅速登上各大平台热搜,引发全网热议。但对于关注豆包发展的业内人士来说,这个消息激起的与其说是惊讶,不如说是一种靴子落地的感觉。

此前,字节跳动的商业化压力已经通过多个维度传递出来:净利润承压、豆包Token日均使用量突破120万亿且算力消耗持续攀升,同时悄悄试水电商变现。这些信号拼在一起已经足够清晰——豆包在认真考虑投入产出比了。

告别纯免费时代,也是国内外AI产品眼下的普遍共识,豆包不过是在合适的时机迈出了这一步。

此次公布的订阅方案分为三档:标准版连续包月68元、包年688元;加强版连续包月200元、包年2048元;专业版连续包月500元、包年5088元。目前订阅服务尚处测试阶段,豆包官方对此回应称,“豆包始终提供免费服务,在免费服务的基础上,豆包也在探索推出更多增值服务,以满足不同用户的差异化需求。”

据接近豆包的人士透露,付费功能将主要聚焦于PPT生成、数据分析、影视制作等复杂任务和生产力场景,免费版则继续面向日常轻量使用。

这一步的意义不止于豆包自身。作为国内月活规模最大的AI应用,豆包的付费探索,既是一次商业模式的自我验证,也将成为观察国内用户AI付费意愿的公开试验——它背后的逻辑、竞争格局的连锁反应,以及与全球AI商业化浪潮的关系,值得逐一拆解。

豆包为何在此时启动付费订阅?

豆包选择在此时启动付费订阅,是技术投入、用户基础、需求分层与行业趋势共同驱动的结果,背后有清晰的商业逻辑支撑。

首先是持续攀升的成本压力。据媒体报道,字节跳动2025年净利润同比下滑超70%2025年三四季度大幅加码AI全链条投入是主要原因。对此,抖音集团副总裁李亮在微博发文澄清,称该数字基于国际会计准则,实际经营利润率仅“小幅下滑”,“远没有报道中这么大幅度”。但他同时确认,“抖音电商增速放缓和新兴业务相关投入增大”确实对下半年经营利润率造成了压力。

在具体产品层面,豆包大模型日均Token使用量截至20263月突破120万亿,三个月内翻了一倍,较20245月发布时增长了1000倍,算力成本的消耗以肉眼可见的速度攀升。随着Seedance 2.0全面开放,专业用户在视频生成等场景的算力需求进一步抬升,如何在不同产品线之间合理分配算力,已经是摆在字节桌面上的现实问题。

据不少用户反映,豆包此前已对专家模式、超能模式设置了使用额度限制,无限度的免费供给已难以为继。C端订阅付费,是覆盖成本、实现投入产出正向循环的直接路径。

其次,行业领先的用户规模与心智渗透率,为付费落地提供了底气。QuestMobile数据显示,截至20263月,豆包月活接近3.45亿,日活约1.4亿,月人均使用次数达54.8次。花旗研究Innovation Lab20263月对1800名受访者开展的专项调查显示,豆包以79%的用户渗透率领跑国内AI应用市场,“最常用产品”占比达63%

在用户心智上的领先地位,是豆包推进商业化最重要的筹码。

再者,国内AI用户需求已出现明确分层,差异化商业模式正在成为行业共识。上述花旗研究调查同时揭示了典型的“高渗透、浅使用”格局:83%受访者日均使用时长不足一小时,仅5%超过两小时。

绝大多数用户的基础需求,免费版完全可以覆盖;但少数重度、专业用户对高阶能力有强需求,付费意愿也更强——45%的受访者愿意为高级功能付费,可接受的月均订阅价格均值为48.3元,高于音乐和视频等典型数字内容订阅价格。

豆包通过“基础免费+高阶付费”的模式,可将优质Token资源向高价值用户倾斜,专家模型、视频生成等有次数限制的功能,付费用户将享受更高用量,高峰期排队的热门功能也将引入分流机制。

与此同时,豆包在电商方向的布局正在同步推进。202510月起,豆包陆续接入抖音商城、上线商品卡功能,并打通本地生活服务链路;20263月进一步实现应用内购物闭环,测试“对话即购物”模式——用户在对话中表达消费意图,豆包直接给出商品推荐并完成下单。

这条路线的逻辑是:免费用户可以通过消费行为产生商业价值,AI入口由此转化为电商流量的新触点,两条线并行,形成分层商业闭环。这一路径已被OpenAI的商业化探索验证——其近期推出的“广告换低价”模式与ChatGPT Go低价版,正是基于用户分层的商业化设计。

三档阶梯定价体系本身,也透露出豆包对用户群体的深度数据洞察。从68元到500元的月费跨度,精准覆盖了从普通进阶用户到专业人士的不同需求层次。

68元这个起点颇值得玩味:它既没有向国内视频网站的月费看齐,也没有直接按20美元/月的国际主流订阅价做汇率换算,而是接近于ChatGPT Go8美元档位——据The Information报道,OpenAI正将这一平价版会员作为美国市场以外的主推付费产品,视其为全球最大公约数。

豆包的起价或许也经过了类似的市场测算,在用户付费意愿与商业回报之间找到了一个现实的平衡点。

02 豆包开始“收费”

如何搅动AI市场格局?

豆包开启付费订阅,搅动的不只是自身的商业化节奏,对国内AI应用竞争格局与行业发展产生的影响也不易低估。

首先值得关注的,是这件事对豆包自身基本盘的影响。花旗研究的调查数据已经说明,国内AI用户中轻量使用者占绝对多数,这部分用户的日常需求免费版完全可以承接,他们大概率感受不到任何变化。

基础版持续免费的承诺,在一定程度上也封堵了竞争对手拿“豆包要收费了”做文章的空间,不过市场格局是否会因此松动,最终还要看付费功能落地后的实际体验。

对于专业用户群体来说,这次变化的意义可能比想象中更大。付费高阶功能的推出,或许会改变行业对豆包“娱乐化、大众化”的固有认知,推动市场重新评估其在复杂生产力场景中的真实能力。

值得期待的是,收费本身可能倒逼豆包拿出更多压箱底的能力——不只是在用量上放宽限制,而是真正释放基座模型的上限,让满血版豆包在通用能力上展示出新的可能性。

对于Kimi等已落地订阅制的产品而言,豆包凭借庞大的用户基数与字节的技术支撑入场,多少会挤压其付费用户的增长空间。

竞争对手这边,千问、元宝等产品或许会借机以“免费”作为差异化卖点,但这张牌能打多久,还要看双方在具体场景下的体验差距。在视频生成等高算力场景,HappyHorse 1.0与Seedance 2.0仍存在一定差距;其他场景上各家模型能力各有千秋,短期内纯靠免费策略能否有效截流豆包的专业用户,仍有待观察。

对于整个国内AI行业而言,豆包的这次尝试是一次真正意义上的商业化试验。长期以来,“C端用户愿不愿意为AI付费”始终是悬而未决的核心问题,行业缺乏一个足够大的样本来验证。

豆包作为国民级AI应用,其付费转化率、用户留存与ARPU值表现,将直接为这个问题提供答案,也将探明国内AI付费服务的潜在用户规模天花板。这次尝试的结果,无论走向如何,都将为国内大模型厂商提供宝贵的实践经验。

03 全球AI商业化加速,订阅模式能否落地中国?

豆包开启付费订阅,并不是字节一家的动作,而是2026年全球AI行业商业化全面加速的集中缩影。

这一行业转向,有着坚实的底层支撑。根据Xsignal AI Holo数据库的季度报告,2026Q1全球AI应用MAU已突破27亿,其中中国贡献了逾50%的新增量,中国AI应用月活达8.51亿,季度增速51.38%。用户普及的高峰期已经过去,免费获客的边际效益趋近于零。

与此同时,全球AI市场头部格局高度固化,国内也形成了以豆包、千问、DeepSeek为核心的稳定竞争梯队——在这种格局下,继续靠纯免费策略抢份额的必要性已大幅降低。OpenAIAnthropic等头部厂商冲击上市的资本市场压力,则进一步加速了商业化的紧迫性。

AI对工作和生活的深度介入,也让用户的依赖程度远超一般内容消费类产品。一家海外60多人的初创公司被Anthropic莫名封禁全部账号,直接导致业务停转,CTOX上发帖后迅速引发舆论发酵。这个极端案例折射出AI工具已深度嵌入生产流程——这种依赖程度,为付费转化提供了现实基础,也让AI产品的用户粘性远超Netflix等流媒体平台。

在这一背景下,海外头部厂商已全面开启商业化提速。OpenAI近期官宣效仿Netflix,推出“广告换低价”模式,上线低价版ChatGPT GoOpenAI预计ChatGPT Go年内用户规模将突破1.12亿,2026年广告收入目标达25亿美元,2030年进一步扩大至1000亿美元,完成从精英生产力工具到全民信息入口的定位转型。

谷歌则在财报电话会议上明确释放信号,首席商务官Philipp Schindler表示“广告一直是将产品规模化、覆盖数十亿用户的重要手段”Gemini的广告商业化计划已进入筹备阶段。Anthropic则聚焦高价值专业市场,据Xsignal数据,Claude 2026Q1月活增速达287%Claude Code推出六个月内年化营收率已达10亿美元。

国内厂商走的是另一条路。与海外“广告+订阅”双轮驱动的模式不同,国内头部AI产品普遍选择依托自身生态来消化流量价值。豆包背靠字节的抖音电商和本地生活体系,通过场景协同转化免费用户;千问则联动阿里商业生态,推出外卖、打车等生活服务,把AI入口直接接进了消费场景。

国内巨头本就拥有成熟的商业化基础设施,AI产品与其说是独立的变现主体,不如说是整个生态的流量入口和场景触达工具。广告模式在这套逻辑里并非不可能,但在竞争仍处白热化、各家都在争夺用户心智的阶段,率先引入广告的体验代价,可能远大于短期的收入收益。

订阅模式的落地,意味着国内AI商业化的逻辑正在悄悄发生转变。豆包作为国产AI应用的头部玩家,它迈出收费这一步,本身就有示范意义——后面的同行有了参照,整个行业才有可能走出靠倾销换规模的怪圈,进入一个更健康的商业周期。

用专业功能服务付费用户,用商业收入反哺模型能力,免费用户最终也能受益,这套逻辑在ChatGPTClaude身上已经跑通,豆包现在要做的,是验证它在国内市场同样成立。

如果AI真的像水电煤一样常态化接入千家万户,订阅开销迟早会成为每个人账单上固定的一行。豆包此次付费尝试的结果,将成为整个行业观察国内用户AI付费意愿的第一块真正意义上的试金石。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading豆包开启付费订阅,国内AI商业化迎来拐点?

由豆包付费想到,AI到底会长成一门什么生意

(本文作者为 吴怼怼,钛媒体经授权发布)

文 | 吴怼怼

免费获客阶段结束,AI 应用开始进入成本分层 用户分层 商业化验证阶段。

最近,豆包 App Store 页面出现了付费订阅信息:免费基础版之外,可能会有 68 /月标准版、200 /月加强版、500 /月专业版,年费最高 5088 元。

豆包回应是免费服务会继续保留,增值服务方案仍在测试中,当前产品内还没有正式展示相关权益。

这件事可以从几个层面看。

01 这和成本有关,尤其是“重度使用者成本”

豆包这种产品最麻烦的地方在于:用户越喜欢用,平台成本越高。

一个普通用户偶尔问几句话,成本可能可控。

但如果用户开始做这些事:

写长文、生成 PPT、做数据分析、深度研究、图片生成、视频生成、语音实时对话、Agent 多步执行任务。

那就完全不是一个成本等级了。

豆包 Mac 版主打的能力除了聊天,还有搜索、图、写作、翻译、PPT、数据分析,并且强调图片与视频生成、深度研究、会议纪要、文档表格处理等一站式工作流。这些功能本质上都比普通聊天更吃 token、更吃推理、更吃多模态算力。

所以豆包收费,很大概率不是因为普通聊天亏得受不了了,而是因为:

高价值能力和重度用户,不能再无限免费供应。

免费版可以继续存在,用来做入口、日活、品牌心智;但真正消耗大的能力,要通过会员、额度、优先级、专业版来分层。

02  AI 的商业化难点,是“收入固定,但成本浮动”

订阅制有一个天然矛盾:

用户每月付的钱是固定的,但用户消耗的 token 不是固定的。

这和奈飞、腾讯视频爱奇艺还不一样。视频平台一部剧拍完,用户多看几次,边际成本相对有限。AI 不一样,用户每一次深度对话、每一次生成视频、每一次长上下文分析,都要重新占用推理资源。

传统软件模式以及奈飞模式更像:

研发一次→ 复制无限次 → 多卖一份的边际成本接近 0

但大模型服务更像:

研发模型一次→ 每次调用都要算力 → 用户越多、用得越深,推理成本越高。

OpenAIAzure OpenAI 等 API 都是按 token 收费,本质上就说明了这一点:输入 token、输出 token、长上下文、缓存输入都有不同价格,输出 token 通常明显更贵。

OpenAI 官方定价页里,GPT-5.5 短上下文是输入每百万 token 2.5 美元、输出每百万 token 15 美元,缓存输入则低很多。 

这和卖 Office、卖 Photoshop、卖操作系统不是一类经济模型。

字节自己的火山引擎也能看到类似逻辑:豆包模型面向开发者的价格同样按百万 tokens 计费,例如 Doubao-Seed-2.0-pro 显示为 3.2 元起/百万输入 tokens16 元起/百万输出 tokens

这说明一个本质问题:

AI 产品看起来是会员订阅,后台却是按量消耗。但它也不完全等同于餐厅

更准确的说法应该是:

AI 是“软件公司 + 云计算公司 + 电力密集型实业公司”的混合体。

如果一个用户每月付 68 元,但疯狂生成 PPT、视频、长报告,成本可能吃掉大部分收入。

如果一个用户每月付 500 元,但主要用来做高价值工作,消耗可控,那就是好生意。

所以 AI 订阅本质是在做一件事:

把不可控的算力成本,转化成可预测的收入结构。

03 “用户规模竞争”转向“ARPU 竞争”

之前国内 AI 应用竞争,很大程度上是免费抢用户。

豆包为什么能做得大?除了产品有优势,当然还因为字节有流量、产品能力强、免费门槛低。豆包是中国使用最多的 AI 聊天应用,QuestMobile 数据显示其周活跃用户约 1.55 亿,DeepSeek 约 8160 万;同时阿里也通过大额补贴拉动 Qwen 用户增长。

但免费模式有一个问题:

用户规模越大,成本压力越真实。

尤其是中国 AI 产品现在还有价格战。DeepSeek 把模型成本预期打得很低,阿里、字节、腾讯、百度又都不愿意丢入口。于是消费端 AI 很容易陷入一种尴尬:

  • 用户觉得 AI 应该免费;
  • 平台知道 AI 不可能无限免费;
  • 投资人想看增长;
  • 公司内部想看商业闭环。

豆包推出付费版,意味着它想测试一个问题:

中国用户到底愿不愿意为 AI 工作流付钱?

不是为聊天付钱,而是为帮我省时间、做 PPT、写报告、做研究、处理数据、生成视频付钱。

这个差别很关键。

用户很难为你陪我聊天每月付 500 元。

但如果它真能帮一个内容从业者、销售、老师、学生、运营、咨询顾问每天省 1—2 小时,那 68 元、200 元、500 元的接受度就完全不同。

04 这也说明:AI 免费版会保留,但免费版会越来越“有限”

未来 国内AI 原生应用大概率不是一刀切收费,而是四层结构:

第一层:免费版

用于获客、建立使用习惯、保持市场份额。普通聊天、基础问答、轻量搜索会继续免费。

第二层:低价会员

给普通高频用户,比如更高额度、更快速度、更少排队、更好的模型。

第三层:专业版

给内容创作者、职场用户、学生、程序员、研究人员,卖的是 PPT、数据分析、深度研究、文档处理、代码、长上下文。

第四层:企业/API/Agent 服务

按量计费,或者套餐 + 超额计费。这里才是真正能跑商业模型的部分。

豆包现在传出的 68200500 三档,本质就是在试探这个分层。

免费版解决用户规模

标准版解决轻度付费

加强版和专业版解决重度用户成本回收

ChatGPTClaudeGeminiKimi、通义、智谱、豆包,都已经或者即将走向类似结构。区别只在于:谁的免费版最强,谁的付费权益最有感,谁的成本控制最好。

05 为什么AI 订阅比传统 SaaS 难? 

AI 多一个用户、多一次对话、多一次长文总结、多一次 Agent 执行任务,就要多消耗 GPU 推理、电力、显存、带宽、存储和工程运维。

所以 AI 应用公司最核心的问题不是:

有没有用户?

而是:

用户越多,是越赚钱,还是越烧钱?

这点和传统 SaaS 很不一样。传统 SaaS 一旦系统搭好,新增客户的毛利通常很高;但 AI 产品如果用户特别爱用,反而可能带来更高推理成本。现在市场担心 Big Tech 的 AI 投入回报,本质也是这个问题。AlphabetMicrosoftMetaAmazon 等大厂今年 AI 相关投入规模巨大,投资者开始更关注这些 AI 支出什么时候能带来足够回报。

但是AI订阅当然也不能简单类比为餐厅,餐厅很难让一碗面的成本每年下降 80%

 AI 可以。

因为模型推理成本会被几件事不断压低:

  • 第一,芯片变强。
  • 第二,模型变小、蒸馏、量化、MoE 路由更精细。
  • 第三,缓存、批处理、上下文复用会降低重复计算成本。
  • 第四,很多任务不需要最强模型,可以用小模型完成。
  • 第五,企业会从盲目堆 token”转向每个业务结果消耗更少 token”

所以 AI 的边际成本不是 0,但它也不是固定不变的食材成本。

它更像早期云计算:刚开始很贵,但规模、硬件和软件优化会持续压成本。

这也是为什么 OpenAI 定价里缓存输入比普通输入便宜很多。缓存机制存在,本身就说明 AI 服务商在努力把重复计算变成更低成本的类软件化环节。

这就导致 AI 公司需要同时回答三个问题:

第一,用户愿意付多少钱?
这是收入端。

第二,用户每月会消耗多少 token
这是成本端。

第三,模型成本下降速度能不能快过使用量增长?
这是利润率端。

如果答案是:

用户愿意付 200 元,但每月消耗 150 元成本,那这个生意很一般。

如果答案是:用户愿意付 200 元;,成本只有 20 元,而且随着模型优化还能降到 10 元。

 AI 应用又重新接近一个好软件生意。

所以 AI 商业模式真正的核心指标不是 DAU,也不是下载量,而是:

每个付费用户的收入 / 每个付费用户的推理成本。

也就是 AI 版的单位经济模型。

06 这会反过来影响AI 行情  

联系到股市,这件事其实很重要。

市场现在交易 AI,第一阶段看的是:

算力需求会不会爆发。

所以英伟达、台积电、博通、存储、电力设备、数据中心涨。

第二阶段市场会问:

AI 应用有没有用户。

所以 ChatGPT、豆包、KimiQwenCopilotGemini 的用户规模会被关注。

第三阶段,也就是接下来最关键的阶段,市场会问:

这些用户能不能付费?付费之后能不能赚钱?

豆包传出收费,其实就是第三阶段的开始。

如果未来看到这些信号,AI 行情会更健康:

  • 付费转化率不错;
  • 用户没有因为收费大规模流失;
  • 高价专业版有人买单;
  • 企业客户开始规模化采购;
  • 推理成本持续下降;
  • AI 功能带来真实提价能力。

但如果看到相反信号:

  • 用户只愿意免费用;付费版口碑差;
  • 平台不断降价促销;
  • 高频用户把成本打爆;
  • AI 应用收入增长快但毛利率不好;

那市场就会开始怀疑:

AI 应用层是不是一个好生意?

这会进一步传导到上游。因为如果应用层赚不到钱,云厂商和模型厂商就会被问:你们为什么还要持续加大 capex

07 不同AI 公司,经济模型完全不一样  

还有一个问题是,不能把所有 AI 公司混在一起看。

这些是卖铲子的。

别人用 AI 越多,它们越赚钱。

它们不用直接承担终端用户 token 成本,反而吃的是 AI 推理和训练扩张带来的资本开支。

它们介于中间。

一方面,AI 带来云收入增长;另一方面,它们自己要承担巨额 capex、折旧、电力和数据中心成本。Reuters Breakingviews 提到,大厂 AI 开支正在大幅扩张,但市场也越来越关心这些投入能否形成清晰回报。

所以云厂商的问题是:

AI 云收入增长,能不能覆盖数据中心、GPU、折旧和电力成本?

用户用得越多,成本越高。

如果是固定订阅制,比如每月收一个固定价格,但用户疯狂使用,那毛利率会被吃掉。

所以 AI 应用最理想的状态不是用户无限聊天,而是:

用户愿意高付费,但实际 token 消耗可控。

比如企业愿意为一个 AI 销售助手、AI 代码助手、AI 法务助手每月付 3050100 美元,但它背后的推理成本只有几美元,那就是好生意。

比如微软、AdobeSalesforce 这类公司,如果能在原有软件上加 AI 功能,提高 ARPU,但不让成本失控,它们就能把 AI 变成提价工具。

AI 对它们不是重新创业,是原有软件分发渠道 + AI 加价包。

08 所以AI 最大的估值分歧就在这里  

完全不必争论AI 有没有用,有没有未来,AI当然是未来。

更深层的问题是:AI 到底是高毛利软件,还是重资本实业?

 乐观派认为:

AI 成本会快速下降,应用会爆发,ARPU 会上升,最后它还是软件式高毛利生意。

悲观派认为:

AI 会变成军备竞赛,大家都要买 GPU、建数据中心、付电费,但用户未必愿意为每个 token 付足够高的价格,最后利润被基础设施成本吃掉。

我觉得真相在中间:

基础模型和云基础设施会越来越像重资产行业;真正有分发、有场景、有定价权的 AI 应用,才有机会重新变成软件生意。

09 这也解释了为什么AI 行情可能会分化  

第一阶段,市场买的是:

谁和 AI 沾边,谁涨。

第二阶段,市场会问:

谁能把 AI 变成收入?

第三阶段,市场会继续问:

谁能把 AI 收入变成利润和自由现金流?

AI 不像传统软件那样多卖一份几乎零成本,它每次服务都要消耗算力,所以天然带有餐厅、云计算和实业公司的成本属性。

 AI 也不像餐厅那么线性,因为模型优化、缓存、芯片进步、批处理、小模型路由,会让单位成本持续下降。

所以 AI 商业模式真正要看的不是有没有收入,而是:

每一美元AI 收入背后,需要烧掉多少 GPU、电力和 token 成本。

这就是接下来市场会反复拷问 AI 公司的核心问题。

AI 的未来,到底有多少利润率。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading由豆包付费想到,AI到底会长成一门什么生意

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

今日,Steam官方手柄Steam Controller正式开售,而据GamesRadar+报道,尽管Valve此前曾表示产品“首发时有充足的库存”,但在开售的瞬间依旧被挤爆,产品被抢购一空。

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

报道称,本轮手柄预订原定于今天凌晨一点,但就玩家社区的反应来看,Valve实际上提前了几分钟。

而在开售后,订单瞬间涌入,Valve服务器立刻不堪重负,大量玩家在尝试下单时不断遭遇报错,根本无法完成购买。

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

仅用了大约35分钟,这款手柄的官方订购页面就显示“缺货”(至少在北美地区)。

有些玩家在不断刷新和重试后幸运下单成功,但对大多数人来说,这一轮首发基本已经结束。

虽然期间偶尔会因为订单取消而短暂补货,但整体来看,首批库存已经彻底售罄。

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

当然,玩家们依然可以“轻松”买到Steam手柄——前提是愿意支付溢价。

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

据介绍目前eBay等平台已经充斥着黄牛转卖,且确实有买家在高价成交。

尽管社区普遍呼吁不要助长黄牛行为,但仍有不少标价200美元(折合人民币约1366元)以上的商品已经售出。

作为参考,Steam手柄的官方定价为99美元(折合人民币约676元),黄牛价翻了一倍。

Steam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300

35分钟售罄、服务器直接被冲爆,这热度确实离谱。

但另一边,黄牛直接把价格翻倍甚至更高,居然还有人买单——到底是产品真香,还是玩家太容易被“割”?

抛开黄牛不谈,单看原价,你觉得这款Steam手柄到底值不值这个价?你会为这款手柄买单吗?评论区说说你的判断。

Continue ReadingSteam手柄卖爆!35分钟售罄 服务器崩溃 黄牛价1300