免费 1500 次背后,商汤在下一盘什么棋

作者|Cynthia

编辑| 郑玄

 

商汤最近做了一件大多数大模型公司都不舍得做的事。

每 5 小时 1500 次免费调用,Token 消耗比同行低 60%,三款新产品同步上线,还把核心模型 U1 以 Apache 2.0 协议全面开源——在大模型公司普遍在想怎么收费的当下,商汤在反向操作。

免费从来不是目的。问题是,它图什么?答案,是一套从模型、工具链到生态锁定的三层护城河。

如果要给过去三年的大模型行业挑个刺,人肉胶水一定排得上号。

一方面,模型能力越来越强,编程、问答、推理、绘画,单点拿出来都是专家水平。但问题也跟着来了,这些 SOTA 级的能力,本质上还是一座座互不相通的孤岛。

在内容创作、设计创意、编程等工作中,AI 负责了最有创意的环节,却把图文整合、校对、排版、内容搬运这些脏活,留给了人类。技术提升带来的效率红利,有相当一部分被胶水成本吃掉了。

那么,能不能把完整方案生成变成模型内置能力?商汤的回答是:不光能,而且免费。

就在前几天,商汤一举推出了三个具备完整交付能力的产品与模型:

SenseNova 6.7 Flash-Lite :新一代多模态智能体模型,具备顶尖的 Agent 能力,为复杂数据分析与任务规划而生,能很好适配高频、高并发的生产级办公需求。

SenseNova U1 :基于自研的 NEO-unify 原生理解生成统一架构,首创连续图文创作输出,实现复杂信息图生成。

全线办公技能 SenseNova-Skills :支持海量数据分析、自动化办公等实战场景。

而伴随着产品上线,商汤还推出了 SenseNova Token Plan,赠送首月每 5 小时 1500 次免费调用额度 ,不可谓不豪横。

要理解这套打法背后的逻辑,先从护城河的第一层说起。

 

01

第一层护城河:做别人做不到的事

 

SeneNova U1:从「会画画」到「会思考再画画」,差距在哪里?

先聊几个数字。

U1 于 4 月 28 日正式发布,两个版本的模型权重(SenseNova-U1-8B-MoT 和 SenseNova-U1-A3B-MoT)均采用 Apache 2.0 协议开源,支持商业使用和本地部署。发布后迅速在 Hugging Face 收获大量开发者关注,成功冲进 Trending 榜前列。这个热度,在最近扎堆发布的开源多模态模型里,实属少见。

它凭什么?答案在架构里。

商汤 SenseNova U1 技术报告认为,多模态智能不应只是把视觉编码器、语言模型和图像生成器拼接起来,而应在同一表示空间中同时完成”看、读、想、画”。 这是 U1 系列模型的核心技术理念,也是 NEO-Unify 架构的出发点。

传统多模态模型的架构,是视觉编码器 (VE) + 变分自编码器 (VAE) 的组合——用 VE 做理解、用 VAE/扩散潜空间做生成。看图和画画是两套独立系统,模态转换过程会带来信息丢失,表示空间也是割裂的。

NEO-Unify 的做法截然不同:直接在像素 patch 与文本 token 上端到端建模,统一支持视觉理解、图像生成、图像编辑、交错图文生成等任务。理解和生成不再是上下游模块,而是同一上下文中的两种推理视角。

 

 

具体到架构设计上,NEO-Unify 同时解决了三组长期存在的矛盾:

第一,近无损视觉接口。 输入端不用 CLIP、SigLIP 等预训练视觉编码器,而用两层卷积加 GELU 将图像转为 token;输出端不用 VAE decoder,而用两层 MLP 直接预测原始像素 patch。表示空间由模型自身学习,既能承载高层语义,也保留生成所需的局部纹理、文字边缘和结构细节。

第二,分辨率自适应 flow matching。 动态分辨率会导致固定噪声先验在不同尺度下信噪比不一致,U1 引入分辨率自适应噪声尺度,使 256 到 2048 等不同分辨率下的像素空间生成更稳定。

第三,原生 Mixture-of-Transformers(MoT)。 理解流与生成流共享 self-attention 上下文,但 Q/K/V/O、LayerNorm、MLP 等参数解耦;文本、理解图像 token、生成图像 token 在每层交互,却保留各自表征专长。同时,三维 RoPE 把 token 放入时间、高度、宽度三轴坐标,从位置编码层面统一了语言顺序与二维结构。

这套机制的关键价值在于:MoT 的参数解耦加共享注意力上下文,能降低理解与生成之间的内在冲突。消融实验也证实了这一点——即使生成数据和理解数据共同训练,理解能力仍保持稳定,生成能力反而收敛更快。统一架构不是折中,而是带来了真正的跨能力协同。

这不只是架构描述, 有数据为证: 即便是 2B 参数量的 NEO-Unify 模型,在图像重建基准 MS COCO 2017 上,也达到了 31.56 PSNR、0.85 SSIM 的成绩,与公认的业界标杆 Flux VAE(32.65 PSNR、0.91 SSIM)差距不足 1 个百分点——而 Flux VAE 是一个专门为生成优化的独立组件,U1 是用一个统一架构顺带完成的。更值得关注的是,与同类统一模型 BAGEL 相比,NEO-Unify 在更少的训练 token 下取得了更好的表现,数据效率的优势相当显著。

实测效果如何?

技术报告显示,在基准测试中 SenseNova U1 展现出均衡且出色的能力谱系。多模态理解上,A3B-MoT 在 MMMU 达 80.55、MMMU-Pro 达 72.83,OCRBench 达 91.90,说明文本密集图像和通用视觉理解没有因统一生成而削弱。生成方面,GenEval 总分约 0.91-0.92,组合、计数、颜色、位置和属性绑定稳定;OneIG 英/中文文本维度最高达 0.969/0.977,LongText-Bench 英/中文达 0.979/0.962,长文本渲染能力尤为突出。

SenseNova-U1 与其他顶级多模态理解模型在多模态基准测试(Benchmarks)

 

GenEval 上的定量评估结果

 

在图文交错生成(OneIG 中英文、LongText 中英文、CVTG)和信息图专项(BizGenEval Easy/Hard、IGenBench)的延迟-性能综合对比里,U1 在同等延迟区间内综合表现领先 Nano-Banana、Gemma-4 等主流开源模型,是目前开源模型里的 SOTA 水平。在与商业闭源模型的横向对比中,U1 Lite 在通用图像生成上的输出质量已与 Qwen-Image 2.0 Pro、Seedream 4.5 持平;在信息图这个历来是开源模型”滑铁卢”的领域,同样达到了商业级水准。

举个例子,输入「帮我生成一道做炒野生菌的教程」。完整的图文混排内容,就在十几秒时间里完整处理好了。它能在多轮推理过程中,边进行逻辑推导,写文字并输出食材、数量、配料、火候,动作对应的草图,再利用这些自行生成的视觉内容继续辅助后续推理,生成图文并茂的完整教程。

 

 

生成信息图也是一句话的事。比如,让它生成极简风的大自然碳循环图。整张图里的自然界碳循环逻辑完全正确,没有信息遗漏。在信息呈现上,以模块化区分不同功能模块,用符号化的视觉元素替代纯文字表述,既保留了有机物化学式、碳酸盐等专业细节,又通过自然系配色与具象化场景降低了大众认知门槛。从信息准确度、视觉层级、专业细节保留三个维度来看,是一张相当成熟的科普可视化作品。

 

 

过去,AI 无法做到的根本原因在于,类似的内容产出不仅是画得好,更需要排版美、信息准确、逻辑清晰、字体统一,是多个能力的综合考验。传统的分步生成再拼接模式,一个环节做到 90 分,连续经过五个环节,生成的就是一个只有 59 分的残次品。

U1 系列模型,通过将理解、推理、生成统一为一个整体,首次让 AI 交付一个及格线上的完整结果成为了可能。这正是去掉了创意端最厚的那层人肉胶水。

 

02

第二层护城河:低成本把人留住

 

SenseNova 6.7 Flash-Lite:当 AI 能真正看懂文档,工作流效率翻几倍?

U1 更像一个多才多艺的创作者,而 SenseNova 6.7 Flash-Lite 更像一个能管理全局的项目经理。

如果说 U1 解决的是创意端的闭环问题,那 SenseNova 6.7 Flash-Lite 解决的则是完整工作流的问题。它专门为真实世界工作流而生,能稳定支撑数据分析、深度调研、复杂图片理解、PPT 生成这些长链路办公任务。能力上,它原生支持 OpenClaw、Hermes Agent 等智能体框架,配合 SenseNova-Skills,可以一键开启全自动办公

传统智能体模型采用语言+视觉拼接设计,视觉只是文本的补充,无法深度参与核心决策与推理循环。信息在转译过程中受损,也会导致 Token 消耗虚高。

6.7 Flash-Lite 不一样。它能直接看懂复杂的网页布局、文档结构、财务图表,实现看、想、做一体化。借助这种真正的「看懂」,6.7 Flash-Lite 也做到了 Token 消耗直降 60%——在信息搜索等场景,对比纯文本智能体,这个节省幅度相当可观。

这正是第二层护城河的核心: 让用户用得更便宜,便宜到不值得换一个平台。

一个案例。给它一段 36 个月、近 90 万行销售记录的数据,让它完成完整的企业运营分析报告。

模型没有直接跳入统计,而是先进行数据审计,敏锐地察觉到单价中的异常离群值,判断这些极值对应了促销或高端单品场景,予以保留以反映真实市场波动。 这是模型主动发现的问题,而非用户指定分析方向——这才是真正的亮点所在。

 

 

分析毛利时发现辣椒类 2022 年 5 月出现严重负毛利,进一步探寻供应链环节,诊断出采购成本控制与零售定价间缺乏联动机制的问题,并主动提出了五项精准建议:建立动态定价机制、调整品类结构等,直接辅助管理层决策。

 

当然,6.7 Flash-Lite 的能力远远不止是分析数据。

数据分析之外,6.7 Flash-Lite 还能直接生成 PPT。从叙事逻辑到版面设计全自动产出,风格统一、元素对齐,生成即交付。从数据分析到内容呈现,中间不再需要人来搬运——这正是去掉了交付端最后一层人肉胶水。

 

03

第三层护城河:工具链让人走不掉

 

大模型公司的竞争,已经从模型能力蔓延到了生态与场景。

当 GPT 和 Claude 的能力差距已经从代际碾压变成各有千秋,开源模型的能力已经不断逼近闭源 SOTA 水平,单靠模型性能已经很难形成持续的竞争优势。这时候,谁能让用户用得更省心、更便宜、更完整,谁就能在激烈的竞争中脱颖而出。

商汤的 SenseNova 体系,正是新规则下的代表性玩家。

要理解这套生态的锁定逻辑,可以借用一个经典的商业模型:剃须刀与刀片。

免费或低价提供剃须刀(模型和调用额度),通过持续消耗刀片(工具链使用量和规模化付费)来盈利。商汤的三层护城河,本质上都是在服务这一个飞轮。

模型差异化, 是让人愿意第一次进来。NEO-Unify 架构让 U1 在信息图生成、图文交错、多步推理上做出了真正的差异——技术报告中的消融实验也证实,这种统一不是能力折中,而是带来了理解与生成的双向协同增益,是竞争对手短期内难以复制的技术壁垒。

低成本 Token 输出, 是让人不舍得走。首月每 5 小时 1500 次的免费额度,加上长期比同行低 60% 的 Token 消耗,把试错成本压到最低。Apache 2.0 的开源协议,进一步消除了开发者进入的心理门槛。

值得一提的是,U1 的推理系统并非停留在论文结构:LightLLM 负责多模态理解与请求调度,LightX2V 负责图像生成,两者通过共享内存和优化传输 kernel 交换状态,FlashAttention3 后端在统一多模态 prefill 中相比 Triton 有约 2.3 到 3.2 倍的加速——正是这套可服务、可扩展的基础设施,才撑起了低成本大规模商用的底气。

 

 

工具链的完整性, 是让人真的走不掉。商汤的生态不只有模型,还包括:

SenseNova-Skills:覆盖信息图生成、PPT 创作、数据分析、深度调研等高频办公场景

Agent Pack:集成了 Hermes Agent 和 OpenClaw 框架的一键部署包

结合起来,当开发者因为低成本开始尝试商汤的工具链,会逐渐被工具链以及交付产品的完整性所吸引;当他们习惯了整套工作流的协作效率,换平台的迁移成本就会变得极高;当这种使用习惯扩散到整个团队,商汤就拥有了用户粘性带来的持续付费。

这套闭环一旦形成,就会在开发者生态中产生网络效应:用的人越多,贡献的反馈和案例越多,模型迭代的方向就越精准,工具链的打磨就越完善,Token Plan 的成本摊薄效应就越明显。

当然,这一飞轮要真正转起来,前提是商汤能在竞争激烈的窗口期内迅速积累足够的用户基数。DeepSeek、Qwen、InternVL 们都在同一条赛道上全力冲刺,这场仗远没有结束。

但至少眼下,商汤给出了一个值得认真对待的答案:用一套从架构创新(NEO-Unify)到工具闭环(SenseNova-Skills)再到成本优势(Token Plan)的完整体系,把”去人肉胶水”从一句口号,变成了可交付的产品。

技术报告的结论说得直接: 多模态智能的未来突破,并不只是简单的规模扩大,更重要的是朝着深度融合进化的内核架构创新。这句话,也许正是商汤这盘棋真正的谜底。

对于开发者和企业来说,现在正是低成本进入这套生态、验证其价值的最佳窗口期。

大模型的竞争里,技术领先只是起点,生态锁定才是终点。

SenseNova U1:

https://github.com/OpenSenseNova/SenseNova-U1/

SenseNova-Skills:

https://github.com/OpenSenseNova/SenseNova-Skills

TokenPlan 免费领取:

https://sensenova.sensetime.com/

*头图来源:商汤科技

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

Continue Reading免费 1500 次背后,商汤在下一盘什么棋

Auto Research 来了:当 AI 开始接管科研里最苦的活,意味着什么

如果几年前有人告诉我,AI 不仅能写代码、生成论文摘要,还能像一个真正的工程师那样,在实验室里反复寻找可行的策略、持续优化一个方案——我大概会觉得这个人科幻片看多了。

但最近读到一篇论文的时候,我的想法变了。

过去两年,大模型的能力突飞猛进,从写诗到写代码,从做数学题到跑实验流程,AI 擅长的事情越来越多。但真正做过科研和工程的人都清楚,最耗人的部分,往往不是提出第一个可行方案,而是后面那段漫长的「长期优化」——一个实验跑通了,但指标还差一点;一个算法能用了,但速度还不够快;一个电池快充策略成立了,但温度、寿命和析锂之间还需要反复平衡。

现实中的高价值成果,很多都不是「做出来」的,而是被持续优化出来的。而这,恰恰是过去大多数 AI Agent 系统最缺失的一环。

最近,Einsia AI 旗下 Navers Lab 发布了一个叫 Frontier-Eng Bench 的新基准测试,正试图衡量这种能力。它没有再把 AI 放进「一问一答」的选择题里,而是直接把 Agent 扔进真实工程优化环境——Agent 必须不断提出方案、运行仿真器、读取反馈、修改策略,在长期迭代中持续逼近更优解。

 

 

论文题目:Frontier-Eng: Benchmarking Self-Evolving Agents on Real-World Engineering Tasks with Generative Optimization

Arxiv: https://arxiv.org/abs/2604.12290

Github: https://github.com/EinsiaLab/Frontier-Engineering

这让我想到一个历史参照:AlphaGo 之所以强大,并不在于它每一步棋都能算对,而在于它能在数百万次自我对弈中持续进化。某种程度上,Frontier-Eng 试图回答的,也是同一个问题——当 AI 开始进入真实世界的长期反馈循环后,智能的本质,究竟该怎么衡量?

 

01

从「一次性答对」到「持续优化」,

范式正在切换

 

要理解 Frontier-Eng Bench 的意义,得先看清楚它在反对什么。

过去几年,大模型领域的 benchmark 越来越多,但本质上都在评估同一件事:模型能不能「一次性生成正确答案」。无论是代码生成、数学推理,还是任务执行,大多数测试的逻辑仍然是——答案对,或者错;任务完成,或者失败。

 

 

Frontier-Eng Bench 总览

但这里有一个被忽视的问题:真实的科研与工程,从来不是一个「对或错」的过程。

一个量子线路已经正确了,但保真度还能不能再往上抠一点?一个 GPU kernel 已经可用了,但速度还不够快?这些问题没有「标准答案」,只有「更优解」。而找到更优解的过程,往往需要成百上千次的迭代、试错和微调。

事实上,这正是 Frontier-Eng Bench 提出的核心命题——论文将其定义为「Generative Optimization」(生成式优化)。它认为,下一代 Agent 的核心能力,不应该只是「一次性给出看起来合理的答案」,而是能否在环境反馈里持续修正自己的轨迹,并在有限预算下不断优化结果。

换句话说,真正的 intelligence,可能本质上是一种长期反馈闭环中的持续优化能力。

这个判断并不只是理论推演。Frontier-Eng 设计了 47 个横跨五大领域的实验任务——量子计算与信息、运筹与决策科学、机器人与控制系统、光学与通信、物理科学与工程设计。在每一个任务中,Agent 都不是简单地「回答问题」,而是需要提出优化方案、运行仿真器、获取真实反馈、修改代码与策略,并在固定的计算预算里持续迭代。

 

 

Frontier-Eng Bench 体系概览

不只有「答对题」的聪明,更有「不断变好」的韧性。这可能才是真正长程智能的起点。

 

02

深度 vs 宽度:Agent 架构的关键抉择

 

在 Frontier-Eng 揭示的所有发现中,有一个结论让我印象最深:关于「推理算力分配」的讨论。

论文通过大量实验发现,Agent 的性能提升遵循一套双重幂律衰减规律——随着任务进入「深水区」,获得显著性能提升的难度呈指数级上升。这是一个残酷但真实的规律:越往后优化,每一个百分点的进步都越来越贵。

 

 

工程优化的双重幂律衰减

但更有意思的发现在于一个架构层面的核心争议:到底是让 Agent 并行尝试 100 种可能性(宽度),还是让它在 1 个路径上通过「反思—修正」递归 100 次(深度)?

Frontier-Eng 给出了一个非常清晰的信号:深度才是那个能撬动真正突破的杠杆。

 

 

深度 vs 宽度

这让我想到一个日常的类比。面对一道难题,是同时翻开十本参考书碰运气更有效,还是沿着一条思路反复推敲、不断修正更容易找到答案?大多数有经验的工程师和科学家都会选后者。Frontier-Eng 的数据,某种程度上用实验验证了这种直觉。

论文将这种能力称为「Deep Iterative Reasoning」(深度迭代推理)。在这背后,其实指向了一个更大的趋势:下一代 Agent 的核心竞争力,可能正在从「知道多少知识」转向「能不能在长期反馈中持续自我修正」。

一个有趣的现象是,这个结论和人类专家解决复杂问题的方式高度一致。顶级的工程师和科学家,几乎从来不靠「灵光一闪」解决核心难题,而是在漫长的试错循环中一步步逼近最优解。某种程度上,Frontier-Eng 证明了:AI 要变得真正聪明,也得学会这种「慢功夫」。

更重要的是,这个发现正在直接改变 Agent 架构设计的方向。过去,开发者们的注意力大多放在 prompt engineering 上——怎么写出更好的提示词,让模型一次就给出好答案。但如果深度迭代推理才是关键,那么未来真正重要的可能是 reasoning architecture——如何构建更强的推理侧架构,让模型能够像人类专家一样进行「慢思考」。

 

03

推理侧的算力红利,才刚刚开始

 

从产业角度看,Frontier-Eng 释放出的信号其实非常强烈。

过去几年,大模型行业的核心护城河主要来自三件事:参数规模、训练算力、高质量数据。谁的模型更大、训练数据更多、GPU 集群更强,谁就占据优势。

但 Frontier-Eng 的实验结果暗示,护城河可能正在发生转移——从训练侧转向推理侧。

 

 

不同模型的详细评测结果

换句话说,未来真正重要的,可能不只是模型「知道什么」,而是它能否在长期环境反馈中持续优化、在复杂搜索空间里稳定收敛、在有限算力下完成递归推理、在真实仿真器中不断自我修正。

这会直接改变整个 Agent 基础设施的竞争方向。因为一旦智能开始更多地来自 inference-time optimization(推理时优化),而不是一次性的预训练,那么几件事将同时发生:

首先,AI for Science 可能将迎来真正的爆发。科学研究本身就是最完美的「生成式优化」场景——提出假设、实验验证、修正假设、再验证,这个循环和 Frontier-Eng 测试的过程几乎完全一致。

其次,Agent 的开发范式会从 prompt engineering 转向 reasoning architecture。开发者将不再仅仅盯着提示词的措辞,而是去思考如何构建更强的推理链、更高效的搜索策略、更智能的反思机制。

此外,长程记忆、工具调用、搜索和反思能力将变得越来越关键,而算力分配本身也会成为一种新的基础设施能力。

从这个角度看,Frontier-Eng 不只是一个学术 benchmark,它更像是一张路线图——告诉整个行业,下一阶段的竞争焦点在哪里。

 

04

尾声

 

回到开头那个问题:AI 做科研,最难替代人类的是哪个环节?

在读 Frontier-Eng 这篇论文之前,我的回答可能是「直觉」和「创造力」。但现在我觉得,答案可能正在被改写。

Frontier-Eng 告诉我们,Agent 正在走出文字游戏的「温室」,进入物理规律的「竞技场」。它们开始学习的,不再只是如何给出一个漂亮的答案,而是如何在成千上万次失败中,一点一点地抠出那 1% 的性能突破。

而身处其中,我们往往后知后觉。但把时间维度拉长,也许多年后回看,2025 年前后这段时间,正是 AI 从「聪明的回答者」变成「执着的优化者」的转折点。

不只有聚光灯下的 OpenAI、Google DeepMind 们在推动这个进程,更有像 Einsia AI 这样的团队,在用严谨的实验框架丈量智能的真实边界。

而下一代 Agent 真正比拼的,可能不再是谁「知道得多」,而是谁能在长期环境反馈中,持续逼近最优解。这场关于「深度」与「反馈」的竞赛,才刚刚鸣枪。

*头图来源: Frontier-Eng Bench

Continue ReadingAuto Research 来了:当 AI 开始接管科研里最苦的活,意味着什么

谷歌在安卓上全面强化 Gemini AI;宇树发布全球首款载人机甲,售价 390 万元;追觅高管回应「崩老头」

Google 在 Android 上全面强化 Gemini AI,从自动操作到生成式桌面组件

在今年 I/O 开发者大会前夕的 Android 专场活动上,Google 再度将重心放在自家通用大模型 Gemini 上,宣布一系列围绕「帮你操控手机」的新功能,这些功能将出现在 Chrome 浏览器、系统自动填表以及更多应用场景中。

Google 同时推出了一个全新的概念名称——「Gemini Intelligence」。据 Google Android 体验总监 Ben Greenwood 介绍,这一名称代表「在最先进的 Android 设备上释放 Gemini 的最佳能力」,本质上是对现有与新功能的一次打包整合,且主要面向 Galaxy S26 等高端旗舰机型,形成类似「高级 Android 体验」的功能集合。

在 Gemini Intelligence 旗下,Google 还首次公布一项名为「Create My Widget(创建我的组件)」的新功能,被官方视作迈向「生成式界面(generative UI)」的第一步。用户只需用自然语言描述自己想要的小组件功能,Gemini 便能自动生成对应的桌面组件。Google 给出的示例包括:为骑行爱好者定制一块突出显示风速和降水概率的天气组件,或是每周自动推荐「三个高蛋白备餐菜谱」的食谱组件。生成后,这些组件不仅能出现在 机桌面,还会同步扩展到 Wear OS 智能手表上,形成跨设备的统一体验。

从交互理念上看,Google 希望用户把组件视作「可以随手用 AI 写在桌面上的迷你应用」,从而推动界面形态向即时生成、按需变化的方向演进。业界也由此关注,Google 是否会在 I/O 大会上进一步阐释「生成式 UI」的长期路线:是让界面真正按场景即刻重构,还是更多停留在组件层面的个性化尝试。(来源:cnbeta)

Google 与 SpaceX 商议在轨道部署数据中心

据外媒援引知情人士消息称,Google 正与 SpaceX 就在太空轨道上部署数据中心展开谈判,探索将太空打造成未来人工智能算力基础设施的新据点。报道指出,双方讨论的核心构想,是在未来几年内,让轨道数据中心成为部署 AI 计算资源的「更低成本」选项之一。

这一潜在合作正值 SpaceX 准备于今年晚些时候推进预计估值高达 1.75 万亿美元的首次公开募股,公司也正尝试向投资者讲述一条更具想象空间的增长故事。除 Google 外,SpaceX 近期还与大模型公司 Anthropic 达成合作,将使用后者位于美国田纳西州孟菲斯的数据中心算力,并保留未来在轨道数据中心层面进一步合作的可能性。值得一提的是,SpaceX 在今年 2 月已经完成对 xAI 的收购,为其在 AI 和算力领域的布局提供了更多内部资源。(来源:财联社)

Apple Intelligence 画饼迟迟无法交付?巴西再对苹果启动调查

5 月 13 日消息,就在苹果就 Apple Intelligence 和 Siri 功能延迟问题与美国消费者达成 2.5 亿美元集体诉讼和解之后,巴西的消费者保护机构也对苹果发起了类似的调查。

据巴西科技媒体 Tecnoblog 报道,里约热内卢的消费者保护机构 Procon Carioca 已于上周五(5 月 8 日)启动行政调查程序,要求苹果在 20 天内就 Apple Intelligence 广告是否误导消费者作出澄清。

本次调查的核心争议在于,苹果在发布 iPhone 16 系列时曾大肆宣传 Apple Intelligence 人工智能功能,但承诺的诸多高级功能至今未能完整交付——尤其是新一代 Siri。

报道称,iPhone 15 Pro 系列及后续机型均被纳入此次调查范围。Procon Carioca 表示正在调查潜在的「信息遗漏、未能履行承诺、以及违反提供清晰、充分且显著信息的义务」,这些做法均被巴西《消费者保护法》所禁止。(来源:快科技)

Anthropic 洽谈融资 300 亿美元,估值超 9000 亿美元

据报道,Anthropic PBC 正与投资者展开初步磋商,计划在新一轮融资中募资至少 300 亿美元,这可能成为该公司迄今规模最大的一轮融资。知情人士称,这家开发 Claude 模型的公司正讨论以超过 9000 亿美元的投前估值进行融资。其中一位人士表示,本轮融资最快可能在本月底完成。目前交易尚未敲定,也未签署任何条款清单。(来源:新浪财经)

三星劳资谈判破裂,5 万人计划罢工 18 天威胁 AI 芯片生产

5 月 13 日,三星电子及其韩国工会未能在周三达成薪资协议。工会领导人表示,预计将有超过 5 万名工人继续推进全面罢工,这可能会扰乱 AI 及其他芯片的生产。

在此次谈判破裂之前,双方在韩国政府的调解下,在周一和周二进行了马拉松式谈判。与此同时,公众和政府方面不断施压,要求三星工人在薪资协议上达成妥协,避免罢工发生。

当地时间周三凌晨 3 点左右,工会代表崔胜浩 (Choi Seung-ho,音译) 对记者表示:「工会提出的议程事项无一得到解决,对此我表示遗憾。」

他表示,公司没有回应工会关于改革薪酬制度的要求,包括取消目前奖金上限。现行规定将奖金最高限制在年基本工资的 50%,并且奖金计算仅以营业利润为依据。

三星工会曾表示,如果要求得不到满足,工人们将从 5 月 21 日起罢工 18 天。这可能会延迟对客户的发货,进一步推高芯片价格,并使竞争对手受益。

崔胜浩表示,他目前暂无在罢工开始前与公司管理层恢复谈判的计划,但如果公司提出「合适的方案」,他愿意予以考虑。

韩国国家劳动关系委员会表示,已提出「多种替代方案」,但鉴于「双方立场存在巨大分歧,且工会要求暂停谈判」,决定终止调解程序。

三星工人对于与竞争对手 SK 海力士之间巨大的奖金差距感到愤怒。在 2022 年底 ChatGPT 发布后,SK 海力士在向英伟达供应 AI 芯片所需的高带宽内存方面超越了三星。SK 海力士去年取消了奖金上限,从而为员工提供了比三星工人高出三倍以上的奖金,这导致三星工会成员数量激增。

截至发稿,三星尚未就此置评。(来源:凤凰科技)

市场监管总局附条件批准腾讯收购喜马拉雅股权案

5 月 12 日消息,市场监管总局发布公告,附加限制性条件批准腾讯收购喜马拉雅公司。该案对维护中国境内在线音频播放平台市场、网络音乐播放平台市场公平竞争秩序,防范平台领域「内卷式」竞争,推动平台经济创新和健康发展具有重要意义。

市场监管总局经过审查,认为该案对中国境内在线音频播放平台市场、网络音乐播放平台市场竞争可能具有排除、限制竞争效果。

为减少此项经营者集中可能产生的不利影响,市场监管总局依法对该案作出附条件批准决定,要求腾讯、喜马拉雅和集中后实体作出五项限制性承诺:

  • 不得提高在线音频播放平台服务价格、降低服务水平或者附加不合理交易条件;

  • 不得降低在线音频播放平台免费内容及免费热门内容比例;

  • 不得与在线音频播放平台版权方达成独家授权,并在规定期限内解除现有独家授权约定;

  • 不得向汽车厂商搭售在线音频播放平台、网络音乐播放平台,或者阻碍、限制其采购竞争对手产品;

  • 不得限制主播在多个在线音频播放平台入驻或分发其享有著作权的作品。

经评估,市场监管总局认为该承诺方案可有效减少本集中导致的竞争问题,能够保障消费者、版权方、主播及汽车厂商等多方主体合法权益,维护相关市场公平竞争秩序,依法于 5 月 11 日附加限制性条件批准本案。(来源:IT 之家)

追觅高管回应「崩老头」

5 月 12 日,自媒体博主「兽楼处」发布文章称追觅创始人俞浩追高流量背后,实际上是麾下有数千家企业嗷嗷待哺,等待第一笔天使轮资金的进入。俞浩盯上的,不是风投机构,而是地方政府的产业基金。

该文章指出,俞浩对外宣称的 200 多个「事业部」,实为 2024 年起在追觅体外成立的大量平台公司和子公司,许多与主营业务无关,甚至涉足辣条、奶茶、房产中介等。

对此,追觅集团联席总裁雷鸣发视频回应:文章整体都是在造谣和抹黑我们,为了博眼球。追觅孵化项目成功率比市场上更高。和地方政府组建基金,会看新孵化项目与地方的综合匹配程度,不是拿了地方钱强行把产业搬过去。(来源:观察者网)

腾讯张军:微信已读功能和访客功能已焊死,不会开发,不会提供

 5 月 12 日消息,针对日前网友热议的「微信状态 访客记录」,腾讯公司公关总监张军今日发文:

「的确,这个小范围测试浏览人数的功能(不具体到个体),被误解了。但这是我们的责任。

已读功能和访客功能,我没记错的话,大家其实反复多次都表明,千万不要有。这里,再次特别强调一下:此二项功能已焊死,不会开发,不会提供。至于此次小范围测试的微信状态浏览人数展示功能,也已停止。感谢大家!」(来源:微博)

黄仁勋称 AI 正创造新的工业时代 蓝领技工将成热门职业

根据英伟达 CEO 黄仁勋的观点,在人工智能时代,需求量最大、潜在收入最高的职业可能不是构建人工智能模型本身,而是满足这项技术庞大基础设施需求的严重短缺的体力劳动工作。当地时间周日,黄仁勋在卡内基梅隆大学 2026 届毕业典礼上发表讲话,描述了人工智能时代的就业市场,其范围远远超出了软件和工程学位所能涵盖的范畴。

「电工、水管工、铁工、技术人员、建筑工人——这是你们的时代,」黄仁勋说道。「人工智能不仅创造了一个新的计算机产业,它正在创造一个新的工业时代。」

黄仁勋认为,对于毕业生而言,传统意义上的蓝领岗位或许是明智之选。他认为,技工行业将拥有大量高薪工作的未来,越来越多的年轻人都开始将这些工作视为切实可行的选择,无论他们是对四年制大学学位感到失望,还是渴望让自己的职业生涯免受人工智能的冲击。(来源:环球市场播报)

苹果 iOS 27 将大幅改进 iPhone 相机应用 所有用户均可获得定制化体验

据彭博社报道,苹果计划在 iOS 27 系统中对 iPhone 相机应用进行重大升级,为用户带来前所未有的自定义功能。这一变革将使专业摄影师和普通用户都能更灵活地控制拍摄参数,从而获得理想的拍摄效果。

据悉,iOS 27 的相机应用将允许用户调整照片风格、分辨率、闪光灯、曝光度、定时器、景深等多项参数。更值得关注的是,苹果将这些功能设计成可自定义的小部件,用户可以按照个人偏好将其排列在相机界面顶部,从而更快速地访问常用功能。

这次软件升级的时机颇具战略意义,因为苹果预计将在 iPhone 18 Pro 和 iPhone 18 Pro Max 上首次引入可变光圈技术。虽然彭博社的报道尚未确认这些自定义选项是否包括根据环境光线手动调节光圈值的功能,但如果该功能得以实现,苹果的旗舰机型有望在无需额外配件的情况下成为专业级摄影和摄像的新标杆。

这一系列变革显示出苹果正在努力平衡易用性与专业性,既要满足普通消费者的日常拍摄需求,又要为摄影爱好者和专业人士提供更深层次的创作工具。(来源:cnbeta)

Google 发布全新 AI 原生笔记本产品线 Googlebooks

当地时间周二,Google 正式发布全新笔记本电脑产品线 Googlebooks,这是一系列围绕其旗舰大模型 Gemini 从零打造的 AI 原生设备。Google 将与宏碁、华硕、戴尔、惠普和联想等硬件合作伙伴联合推出首批 Googlebooks,覆盖多种尺寸与形态,计划于今秋上市。

公司宣称,Googlebooks 是首批从底层即为 Gemini 打造、能够提供个性化和主动式帮助的笔记本电脑。

Googlebooks 最大的亮点之一是系统内置了名为「Magic Pointer」的新型 AI 光标功能,将 Gemini 能力直接融入指针操作。与传统只负责指向与点击的光标不同,用户只需轻微晃动光标,即可在屏幕内容之上唤出即时的上下文建议。

例如,当光标停留在邮件中的日期上时,系统可以直接建议创建会议;而当用户选中两张图片(如客厅照片和一张沙发图片)时,系统可以帮助用户在屏幕上把二者组合在一起进行可视化预览。

在连通性方面,新款 Googlebooks 将与 Android 手机深度协同,用户可以不依赖手机实体设备,直接在笔记本上使用原本安装在手机上的应用。比如,当你在笔记本上工作时突然想起当天的 Duolingo 学习任务,但又不想拿起手机,就可以直接在 Googlebook 上打开并完成该应用。此外,用户还可以通过 Googlebook 的文件浏览器直接访问手机中的文件,在笔记本上进行查看、搜索或插入文档和媒体内容。(来源:IT 之家)

390 万元起!宇树发布全球首款量产版载人变形机甲 GD01

5 月 12 日,据宇树科技官方微博消息,宇树正式发布全球首款量产版载人机甲——GD01 载人变形机甲,起售价 390 万元人民币(约 65 万美元)。

宇树科技 2025 年全年营收已达 17 亿元,人形机器人业务占比突破 50%,毛利率近 60%。眼下,宇树科技正冲刺科创板,剑指 A 股人形机器人第一股。

GD01 的核心技术亮点在于将宇树此前积累的四足与人形机器人技术深度融合,实现了三项关键能力:500 公斤级动态平衡控制、实时人机一体化控制,以及双足与四足模式的无缝切换。

双足模式下,GD01 可在城市街道正常行走与转弯,适应日常城市场景;

切换至四足模式后,机甲可爬越楼梯、应对斜坡及各类极端地形,甚至能以单腿踢倒砖墙。

宇树方面强调,这并非概念原型车,而是一款真正可量产的民用车辆。(来源:华尔街见闻)

欧盟拟出手整治「上瘾式设计」以保护未成年人

欧盟正加大对社交媒体平台的监管力度,计划集中打击 TikTok 和 Instagram 等应用中针对未成年人的「上瘾式设计」功能。欧盟委员会主席冯德莱恩周二在丹麦举行的「人工智能与儿童」欧洲峰会上表示,欧盟将在今年晚些时候对平台采取行动,并推动相关监管落地。

冯德莱恩点名指出,欧盟正在针对 TikTok 的「上瘾式设计」采取措施,其中包括无尽下拉浏览、自动播放以及持续推送通知等功能。她同时表示,同样的问题也存在于 Meta 旗下的 Instagram 和 Facebook 上,这些平台被认为未能有效执行自身订立的 13 岁最低使用年龄规定。她强调,欧盟正在调查那些让儿童陷入「有害内容兔子洞」的平台,例如推动厌食等饮食失调或自残行为的视频内容。(来源:网易)

 

Continue Reading谷歌在安卓上全面强化 Gemini AI;宇树发布全球首款载人机甲,售价 390 万元;追觅高管回应「崩老头」

AI 为什么一定会成为这代人的全新购物入口

作者|Cynthia

编辑| 郑玄

 

有没有发现,去韩国玩的人,不管是旅游还是留学还是出差,只要待的时间稍微一长,几乎都会被朋友拉着去做一个叫色彩测试的东西。

就是你排队两个月,有人拿着色卡在你脸上比划半天,然后告诉你,你是春、夏、秋、冬里的哪一型,你的肤色适合什么色系,你的五官适合什么饱和度,你的日常穿搭应该避开什么材质。

然后,温暖的色彩,就会化身冰冷的几千元,转账到商家的账户,而你回家后打开衣柜,才发现原来自己过去这么多年前,其实从来不会买衣服。

这个生意为什么会爆火?

本质在于购物这件事,其实是一个需要专业技能的技术活。哪怕网上商品有千万种 SKU,哪怕算法推荐越来越精准,但找到适合自己的那一件的门槛,比大多数人的想象要高得多。

就像健身需要私教、学习需要老师,而购物需要「李佳琦」。

而当万物皆可 skill 的时代到来,AI 当然也能把「购物」这个专业技能封装,供所有「想买但说不清楚买什么」的消费者随时调用。

昨天 淘宝与千问的 打通 , 本质上就是完成了这件事。打通后, 用户可以直接在千问 App 里逛淘宝、选商品、下单 。

这是 AI 购物第一次完成闭环, 这场迁徙背后的逻辑,远比换个地方下单要深刻的多。

 

01

买对东西,为什么这么难?

 

对一个选择困难症来说,每次买东西,都是一场精神与钱包的双重折磨:

打开购物平台搜索 「 黑色连衣裙 」 ,能跳出超过两万件商品;搜索 「 保湿面霜 」 ,超过 200 个品牌至少 2000 个产品排队等待翻牌。

但万里挑一之后,为什么买到一个最合适的东西,依然很难?

原因很简单,当我们在购物的时候,我们只部分知道自己要什么,却不知道自己不知道什么,这几乎是人类购物史上永恒的困境。

对女生买衣服来说。绝大多数消费者并不具备专业的服装知识。不知道韩版和欧美版的版型差异意味着什么,不了解天丝和莫代尔的手感区别,不清楚自己到底是什么体型、适合什么剪裁。

而对男生来说,520 即将到来,想送一件让女朋友感动哭了的礼物,在电商平台直接搜索,得到的结果,大概是送命题。

这就是不知道自己不知道的典型场景。

类似的困境其实弥漫在消费世界的每一个角落:

书籍领域:想买本哲学入门,到底该选《苏菲的世界》还是《大问题》?电子产品:想买一台相机,面对 「 全画幅 」 「 APS-C 」 「 M43 」 各种规格,到底哪个适合自己?护肤品:同样是保湿,精华液、乳液、面霜到底该怎么搭配?

因此,过去消费者想要选到最合适自己的那一款,就得反复在线上挑选、退货、加购物车。

线下商业部分的解决了这一问题。我们不难发现那些活得 最好的实体店,无一例外,全都活成了精品商品+专家级导购的样子 ,顶级美妆店配备经验丰富的彩妆师,帮用户选到最合适的美妆,风靡一时的色彩测试,本质上也是在帮助用户搞清楚我想要什么、适合什么。

那么问题来了, 这对社恐,以及没空去实体店逛街的人来说,难度实在过于地狱;线下的导购也非全知全能,再专业的导购,也记不清品牌推出过的所有商品。

这也是为什么,我相信 AI 一定会成为全新的购物入口。

 

02

实测千问购物:24 小时在线的专家导购

治好了我们全家的购物无能

 

之所以尝试在千问中买东西,是因为直到最近,我才意识到,购物是一件需要天赋的事情,而多数人(包括我)在这方面堪比绝望的文盲。

人类永远无法直视自己半年前的淘宝购物历史,就像 90 后永远不会当众朗读自己初中在 qq 空间写下的火星文。

我的朋友,曾在淘宝直播间冲动购物买过一罐来自大草原的空气;而我,也曾蹲在暗无天日的出租屋,一口气买下三盆太阳花后,疯狂搜索教程,太阳花没有太阳怎么开花?

所以, 深度体验了千问的购物功能并把它推荐给身边所有人后,我最深的感受就是,这和把审美最好、懂我喜好、最懂性价比、脾气最好的购物小天才朋友 24 小时带在身边有什么区别?

还是以买一个黑色显瘦连衣裙为例。过去搜索完黑色显瘦连衣裙,网页会跳出上万个链接,每一个模特图都足够精美,但买回来到底适不适合我,全靠运气。

而在千问,AI 会这样工作:

首先,它会主动了解你的基本信息:你的体型是什么?(梨形、苹果型、H 型……)你的肤色如何?平时的穿着偏好?如果是梨形身材,上衣应该选择领口有设计感、下摆略微收紧的款式,来平衡视觉重心。如果是苹果型身材,应该选择 V 领或大圆领、腰部有适当余量的上衣,避免紧身款勒出腹部线条。如果是 H 型身材,可以尝试有收腰设计或腰带装饰的款式,制造曲线感。

最后,在综合我的历史购物偏好、浏览记录后,千问还会先通过几次问答彻底了解了我的审美以及个人特点后,才给出精准推荐,并且每款都附带为什么适合的详细解释。整个过程,就像在线下店遇到了一位既专业又有耐心的导购。

除了买衣服,买书籍这样的专业产品也是同理。前段时间我突然对荷马史诗很感兴趣,但这本书的阅读难度着实不低。诸多版本怎么选择,要读原版还是译本?朱生豪和杨宪益的译本有什么区别?入门读者选哪个版本更容易上手?想深入研究,哪个版本的注释更详尽?

这些信息在传统电商平台上碎片化地散落着,过去需要翻阅大量书评、对比不同版本、甚至多次踩坑才能拼凑出答案。

但在千问,它会告诉我:如果你英文水平较好,AI 推荐你尝试英文原版(推荐 Penguin Classics 或 Oxford World’s Classics 版本)如果你英文阅读有挑战,初学者推荐杨宪益译本(语言流畅、结构清晰),进阶读者可以选朱生豪译本(文学性强、注释详尽)。

当然,周围一圈人中,用千问购物受益的,其实是老家被村口送鸡蛋神医忽悠,差点上头买了治高血压枕头的外公。

在千问中输入「买治高血压枕头」后,他得到的反馈是这样的:

是的, 一个好的购物应用,不只会告诉用户你适合什么,还应该能提醒用户,什么是不合适的。 千问不仅拒绝了老年人买治高血压的枕头的要求,还给出了科普:枕头不治高血压,但选择合适的枕头确实可以改善睡眠质量、间接有助于血压管理。

而且,千问中购物,除了能帮助我们选择商品,还能通过对话直接领券下单、匹配国补、推荐有运费险的商品;想知道物流进度,也能直接对话查询;AI 甚至还能基于历史订单给我们做复购推荐。

过去, 查物流、领券这些看似简单的查询,对年轻人来说虽然繁琐,但尚在接受范围之内;但对很多不熟悉操作的老年人来说,这种极简化操作,几乎是打开了他们电商购物的大门。

 

03

AI 为什么一定会成为新的购物入口

 

其实,把视野拉大到整个商业史, 我们不难发现购物入口的变迁,一直都遵循着一条清晰的脉络:每一次技术革命,都在重新定义效率的含义。

最早,我们在集市、百货、超市购物,用双脚丈量商品。 逛街是一种身体行为,你必须亲临现场,信息获取的效率,取决于你能走多远的路、逛多长的时间 。而在这个过程中,怎么比价、怎么谈价,都需要耗费大量的时间与精力成本。

在此之后,搜索引擎入口出现,我们可以用手动搜索输入替代脚步丈量。信息获取的效率随之大幅提升,但前提是你知道买什么, 搜索引擎只能处理明确需求,面对模糊需求,它束手无策

针对这个困难,算法推荐随之登场,借助短视频电商、内容种草,我们看了一条短视频,下单了一件同款;读了一篇种草笔记,冲动购入了一件爆品。这是一种先有需求、再刺激需求的模式,本质上是把购物变成了一种娱乐体验。但 商品到底买的对不对,适不适合,依然只是基于简单标签的匹配,无法解决根源问题。

对话式 AI 入口的出现,解决了以上的所有瑕疵。人类开始回归自然语言定义需求的模式: 「 我下周要参加一个正式商务晚宴,需要一套低调但有质感的穿搭,预算 2000 以内 」 这些包含了大量的隐性信息,搜索引擎、标签推荐根本无法处理的问题,通过 AI 可以理解、分析、转化,并给出精准推荐。

在这个过程中, 我们收获的是线下式的专业服务、搜索引擎式的海量选择、推荐算法式匹配以及一站式服务。

而更长期来看,当越来越多人开始用 AI 购物,当数据积累越来越丰富,这个体验也会越来越好, 而我们这代人,或许从现在起,又要学会一套新的购物方式了。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

Continue ReadingAI 为什么一定会成为这代人的全新购物入口

中国人形机器人全球爆单:每10台里8台都贴“中国制造”

快科技5月14日消息,据央视财经报道,在新一轮中国品牌出海浪潮中,机器人、人工智能站上舞台C位。

数据显示,2025年,中国占据全球84.7%的人形机器人出货量,全球每卖出10台人形机器人,就有超过8台贴着 “中国制造” 的标签。

去年,中国企业出货量达1.44万台,几乎是美国竞争对手出货总量的9倍,全球出货量前六的企业全部来自中国。

这一格局背后,是中国140+家人形机器人整机企业的集体发力,形成了“双寡头引领(智元、宇树,合计占国内 80% 出货量)、八强跟进”的清晰产业梯队。

我国拥有全球最完整的机器人产业链,从核心零部件(伺服电机、减速器、控制器)到整机制造,实现90%以上国产化率,成本优势显著。

2026年一季度数据显示,中国机器人出口额达113.2亿元,其中人形机器人出口同比增长210%,产品远销全球148个国家和地区,欧洲、东南亚、中东成为主要市场。

摩根士丹利报告指出,中国人形机器人正复刻新能源车成功路径,从成本优势到技术领先,再到全球市场扩张,预计2026年中国销量将翻倍至2.8万台,超过其他任何经济体总和。

中国人形机器人全球爆单:每10台里8台都贴“中国制造”

Continue Reading中国人形机器人全球爆单:每10台里8台都贴“中国制造”

华为9系MPV 想摸着理想MEGA过河

如果有一部电影把MPV当主角,那一定是《阳光小美女》。胡弗一家六口挤在一辆破旧的大众T2里,陪小女儿踏上选美之旅,状况不断却笑中带泪。

在美国和日本,这样的故事每天都在发生。MPV就是一个移动的家,是家庭用车首选。比SUV更能装,操控接近轿车,省油省电。

但在中国,它始终是小众品类。2025年总销量105.8万辆,占比不过5%。

如果你在40年前做过大发面的,那么潜意识里就会对长得像“面包车”的MPV本能抵触,因为大发在当时又吵又颠又破又臭,出行地位仅次于老头乐。后来南京依维柯刚刚入华,就被拉去殡仪馆使用。刻板印象加不吉利,造就了稀烂的中国MPV市场。

理想MEGA曾试图用新势力打法重新定义这个市场。然而事与愿违,4月最新销量仅388台。理想没把高端家用MPV做成爆款,却替后来者做了一件更重要的事:把这条路上最容易踩的坑,几乎踩了个遍。

本月15日,智界V9即将在上海正式开售,尊界S900也不断有消息露出,预计今年上市。种种迹象表明,华为要摸着理想MEGA,重新定义高端新能源MPV。

华为9系MPV 想摸着理想MEGA过河

只不过,随着鸿蒙9系MPV入场,真正的问题已经不是“华为为什么做MPV”,而是:它到底是在复制MEGA没走通的路,还是在吃MEGA试错之后留下的认知红利?

过窄门,走暗路,耕瘦田

作家刘震云说过,普通人想要翻身,就要过窄门,走暗路,耕瘦田。对车企而言,想在窄众市场立足,也得记住这九个字。

MPV就是那道窄门。主流SUV市场单车利润微薄,不过高端MPV是另一回事,虽然量少,但是利润丰厚。岚图梦想家月销稳定在5000台以上,卖一台50万级的MPV,利润抵得上卖10台家用SUV。

华为9系MPV 想摸着理想MEGA过河

华为选择在这个节点进入,走高端路线,那就绕不开小而美的MPV市场。

智界V9开启预售后,一小时斩获1.25万订单,72小时斩获22500台订单,“近半数预定了高配车型(官方数据)”。

这至少说明高端MPV在中国具备不低的关注度和传播势能,但预售热度能否转化为真实需求,还要看后续交付和上险数据。

虎嗅汽车向朝阳区姚家园鸿蒙智行门店问询得知,前来参观试驾的顾客“较同期增长超3倍。”

有销售顾问对虎嗅说:“五一期间不少顾客都是带着孩子家人,一同试驾。主要需求是满足二孩家庭一起出游和日常通勤需要。客户更看重三排座椅空间,三排座家里老人和小孩很需要。”

虎嗅汽车又询问了前来看车的车主,车主表示自己是从抖音刷到智界V9的广告,因为本身就是问界车主,对鸿蒙驾仓赞不绝口。“整体挺好,就是第二排过道上下车不太方便,需要改进。”

消费者购买意愿从问界跨到智界V9,这是虎嗅汽车在之前没想到的。这说明鸿蒙正在从五龙夺嫡中走出来,形成统一的消费者认知标识,以老带新的方式实现对五界其他品牌的赋能,实现共同发展。SUV的产品表现,也影响MPV的上新和转化。

华为9系MPV 想摸着理想MEGA过河
尊界S900媒体渲染图,非正式产品图

这套思路与理想MEGA的家用路径形成鲜明对比。可以理解为理想MEGA在设计语言、动力形式和定价策略上的选择,为后来者智界V9提供了参考样本。

鸿蒙智行没有选择在成熟方案上跟风,而是在技术层面下注。华为的方案包括用智能驾驶和底盘技术提升配置基准,用既有用户基础支撑品牌认知,用前人的市场反馈调整产品定义。

不过暗路走完,并不代表可以耕MPV这块瘦田。MPV单价高但受众面小,意味着产品策略的容错空间极小。

4月MPV销量数据显示,月销5000台的丰田赛那就能拿下第一(在SUV市场月销5000刚过盈亏平衡线),魏牌高山、别克GL8紧随其后。

新能源MPV不容乐观,腾势D9排位下滑至第六,理想MEGA仅售出388台。MPV前三强依然是传统燃油车,新能源渗透率显著低于轿车和SUV。

华为9系MPV 想摸着理想MEGA过河

究其原因MPV用户的核心需求是故障率低、加油方便、保养便宜、出远门不用找充电桩、冬天开空调不担心续航打折。但当下许多新能源MPV的产品策略,与这些底层需求产生了根本性错配。这意味着鸿蒙智行两款MPV如果仅仅是和SUV一样宣传技术豪华等产品,未必会掀起浪花。

这是因为每个细分市场有其运行逻辑。以日本市场为例,丰田Sienta、本田Freed、日产Serena,长期占据销量前列,依靠的不是配置参数,而是侧滑门对老人的便利、低地台对儿童的友好,以及长期积累的可靠性和保值率。中国MPV要从工具车认知转向家用车认知,也需要产品力之外的信任积累。

MPV是个慢生意,华为怎么把握火候?

对华为来说,真正的挑战从来不是怎么把一台MPV做得更像华为,如何适应MPV的市场节奏。

第一,  智能化到底是不是MPV用户愿意付钱的核心理由?

这是华为最有优势、也是最值得怀疑的一点。

过去几年,华为在SUV和轿车市场建立起了一个几乎无往不利的叙事:智能驾驶、智能座舱、底盘控制和生态联动,可以把一台车的产品价值整体抬高一个维度。

但MPV不是SUV。SUV用户更容易为新鲜体验、驾驶辅助和科技感买单,MPV用户首先关心的却是另一套东西:空间够不够实用、满载是否稳定、长途补能麻不麻烦、老人孩子上下车方不方便、三年后小毛病多不多。

换句话说,智能化在MPV上当然重要,但它更像加分项,而不是决定性购买因素。

这也是为什么华为做MPV,不能简单理解成“把SUV上的成功经验复制一遍”。在MPV市场,技术领先不自动等于市场领先。

华为9系MPV 想摸着理想MEGA过河

但华为的逻辑在于,当下MPV前十名智能化水平普遍落后于同价位SUV和轿车。华为鸿蒙拿智能驾驶、底盘、座舱三大件砸向MPV赛道。不仅是技术补课,是产品升级。不在SUV红海里拼配置,而是用技术重新制定游戏规则。直白点说,华为不在乎MPV的慢节奏,它试图用产品的绝对影响力来自己打节奏。

鸿蒙发布会上,有智界市场人员对虎嗅汽车表示:“过去燃油MPV不注重科技感。智界V9通过搭载全域融合架构,将路况空间模型分辨率提升100倍。L3级智能驾驶架构、天使座主动安全防护、华为巨鲸电池2.0。科技豪华对传统燃油MPV实现降维打击。”

近期,智界刚刚履新的执行副总裁赵长江在接受新出行对话时也表示,智界V9的购车者中,不少是此前驾驶豪华燃油SUV和MPV的用户。这类消费者具备较强的购买力,对产品性能和科技配置有着极高的要求。那么智能化到底是不是MPV用户愿意付钱的核心理由?静待上海发布会之后的上市交付了。

第二,水面之下,华为25000家门店是否会提高MPV产品的影响力?

智能化是真需求还是伪需求,还要看最终的交付成果如何。

但有一点赵长江说的是对的:

“品牌还将考虑拓展独立销售渠道,并向三四线城市下沉,以更贴近用户的方式提供便捷、优质的服务体验。”赵长江说。

数据显示,二孩政策以来,三四线城市二胎生育意愿强烈东莞、汕头、佛山超10‰。而在一线城市,迫于生活压力,生育意愿全国垫底。以北京为例,常住人口出生率仅为5.63‰。因此MPV作为二孩家庭首选,必然会积极布局三四线城市。

华为9系MPV 想摸着理想MEGA过河

从收入结构看,三四线城市虽然整体收入不高,但生活成本更低,无房贷压力,有更多预算购买MPV;用户画像方面,三代同堂多孩家庭是MPV消费绝对主流;

补能方面,全国充电设施乡镇覆盖率已达80.02%,县域覆盖率为97.08%;

而在品牌接受度方面,无论理想蔚来还是小鹏,与华为小米这些品牌相比还不够下沉。数据显示,华为手机全国门店25000家,小米18000家,手机门店对汽车具有极高的导流能力,不少店铺可以直接将展车放到手机门店,并完成交付。

反观蔚小理,截止2026年4月,三家全国门店总数只有1,775个,无法覆盖三四线以下城市。这意味着用户看不到实车,也无法试驾,让“试驾”这一重要销售手段在下沉市场失灵,无法带来销量转化。

聚焦到理想MEGA,营销资源过于集中在一线城市,想当然认为一线城市高端MPV需求强烈,错误的忽视三四线二孩家庭真实需求,造成现在的结果并不意外。

华为9系MPV 想摸着理想MEGA过河

华为9系MPV 想摸着理想MEGA过河

第三,SUV光环能帮华为系MPV打开市场吗?

过去几年,理想MEGA的失利折在了造型争议、纯电焦虑、定价错位。极氪009式微进一步验证了纯电路线在MPV领域的天然承压。腾势D9连续下滑也最终证明了MPV产品定义容错率极低,MPV市场用户都是人精,想让他们掏钱不容易。

华为此时入局,恰恰是在对手已经把”不要做什么”写满黑板之后才落子,等于说华为在替理想重新定义MEGA。智界V9增程加纯电双路线、稳妥商务造型、40到60万卡位,基本算是踩着MEGA的坑过河,比摸着石头强。

华为今天最大的现实优势,不是它已经证明自己最懂MPV,而是它已经在高端车市场证明自己有能力把“贵”卖出去。从问界M9到尊界S800,华为完成的是一件比卖车更重要的事:它让一部分用户开始相信,国产高端车也可以承接身份感、品质感和品牌溢价。

问题在于,MPV的品牌迁移难度,其实高于SUV。

SUV天然是主流品类,用户对新品牌的接受度更高,也更愿意尝试“新豪华”。但MPV不是。它长期被商务属性、工具属性和“家庭大车”的低频决策逻辑绑定,用户更保守,决策也更慢。很多人买SUV,会因为一项新技术心动;但买MPV,往往要把全家的使用场景、补能便利、长期养护和保值率一起算清楚。

所以,华为的品牌势能当然能帮鸿蒙9系拿到第一波关注、第一波订单,甚至第一波高端认知;但它能不能转化成MPV市场最看重的长期信任,还远没有被证明。在这个品类里,品牌光环可以帮你进决赛,但很难替你踢完加时赛。

MEGA做产品,鸿蒙做生意

把鸿蒙9系和MEGA放在一起比较,表面上看是在比较两款车,实际上是在比较两种完全不同的产品逻辑。

理想对MPV的理解,更接近“家庭出行终极形态”。李想看到的是一个非常具体、也非常感性的场景:一家人长途出行,SUV不够舒适,传统MPV又不够安静、不够先进,于是需要一台把空间、舒适和家庭体验做到极致的新物种。

MEGA的很多设计,都是从这个逻辑出发的。因此要把空间效率要做到极致,纯电平台要带来更好的静谧性和乘坐体验,造型也要足够前卫,像一个明确属于新时代家庭的产品。

这个逻辑本身并没有错,甚至很先进。问题在于,它默认了一件事:用户愿意为了更先进的家庭体验,去承担更高的认知成本和使用风险。

可MPV用户恰恰不是这样一群人。他们当然需要更好的空间和舒适,但前提是不能因此失去确定性。

补能焦虑、造型争议、价格门槛,这些在理想看来可以被产品价值覆盖的问题,在MPV用户眼里,往往是先于产品价值存在的决策障碍。

所以MEGA的问题,不是把MPV想错了,而是把用户接受新MPV的速度想快了。

华为的逻辑则完全不同。它并不试图重新发明MPV,而是先接受这个市场的保守性,再在保守框架里做升级。增程和纯电双路线,是在降低补能焦虑;更稳妥的造型,是在降低审美门槛;智能化、安全和座舱健康这些配置,则是在传统高端MPV“豪华装修”逻辑之外,补上新的价值维度。

换句话说,理想想做的是“未来的MPV”,华为想卖的是“今天用户敢买的MPV”。

这也是两者最大的区别。李想更像是在用一款产品提前定义市场,余承东则更像是在市场已经暴露边界之后,重新组织一套更容易成交的解法。前者更有理想主义色彩,后者更有生意人的现实感。

从战术上看,华为显然更占便宜。因为MEGA已经替全行业验证过:高端家用MPV不是不能做,但不能用过于激进的方式去做。华为只要把这些坑绕开,就能在产品定义上显得更稳、更成熟,也更容易被用户理解。

但如果把时间拉长,事情就没那么简单。因为华为今天解决的,更多还是“怎么把用户先买进来”的问题;而MPV真正的胜负手,在于“怎么让用户长期留下来,并愿意推荐给别人”。

所以说,余承东和李想的差别,不是谁更懂MPV,而是谁选择了不同的切入时点和不同的风险承担方式。理想是在市场尚未成熟时抢着定义它,华为则是在别人试错之后,选择用更低风险的方式接管它。

这也是为什么今天看鸿蒙9系,最准确的说法不是“它比MEGA更强”,而是:它比MEGA更像一门生意。

鸿蒙的瘦田,不是谁都能耕

窄门过了,暗路也走了,最后一步才最见功夫:耕瘦田。

回到标题那个问题:鸿蒙9系MPV,想摸着理想MEGA过河,这对吗?

对,因为MEGA确实替后来者踩出了边界。它让所有人都看清楚,高端家用MPV这条路上,哪些坑最深:过于激进的造型、过于单一的补能路线、过于乐观的市场预期,以及试图用一款车快速教育整个市场的冲动。

华为显然吸取了这些教训,所以鸿蒙9系从路线、造型到节奏,都比MEGA更稳。

但也不全对。因为摸着前人的坑过河,只能说明你更不容易摔倒,不代表你已经知道河对岸在哪里。

MPV不是一个靠少犯错就能赢的市场。它真正难的地方,不在于把车做出来,而在于让用户愿意长期相信你。这个市场看起来卖的是空间、豪华和配置,实际上卖的是另一套更慢的东西:可靠性、便利性、保值率,以及全家人都能感知到的低风险体验。

这也是华为接下来绕不过去的三道坎。

一是市场太小,容不下太多乐观

中国MPV年销量不过百万辆出头,月销5000台就足以争冠。高端MPV当然能挣钱,但它首先是“小池深水”,不是“大江大河”。华为进入这个市场,更像是在扩展高端品牌边界,而不是找到一个新的走量引擎。

二是智能化是卖点,但不是MPV痛点

华为最擅长的是把技术变成卖点,但MPV用户最在意的,往往不是卖点,而是确定性。长途补能顺不顺、满员出行稳不稳、老人孩子用起来方不方便、几年后会不会一堆小毛病,这些问题如果解决不了,再强的智能化也很难真正转化成长期口碑。

三是时间门槛无法跳过

MPV市场不是靠一场发布会赢下来的,也不是靠一波预售订单坐稳的。它更像一场慢跑:首批用户开一年、两年、三年之后,愿不愿意复购,愿不愿意转介绍,愿不愿意在家庭聚会和生意场上替你说话,这才是真正决定胜负的东西。

所以,鸿蒙9系当然可以借MEGA的教训上岸,但能不能站稳,靠的不是MEGA,而是它自己。

华为现在最大的优势,不是更懂MPV,而是更晚进入MPV。它因此显得更稳、更克制,也更像一个在别人试错之后来接管市场的人。

可MPV终究是一门慢生意。

技术可以弯道超车,口碑从来都是直道慢跑。前两步,华为走得都不算差;最后一步,谁也急不得。

Continue Reading华为9系MPV 想摸着理想MEGA过河